Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.
| dc.contributor.advisor | Poma Calle, Oscar Marcelo | |
| dc.contributor.author | Iturralde Aliaga, Rodrigo Orlando | |
| dc.coverage.spatial | Bolivia | |
| dc.date.accessioned | 2026-03-22T12:44:48Z | |
| dc.date.available | 2026-03-22T12:44:48Z | |
| dc.date.issued | 2024 | |
| dc.description.abstract | La Universidad Mayor de San Andrés (UMSA) está digitalizando sus bibliotecas y creando una biblioteca virtual para almacenar los documentos académicos elaborados por sus estudiantes (proyecto de grado, tesis, etc.). Sin embargo, aún hay miles de estos documentos pendientes de ser indexados y publicados en la biblioteca. El proceso de indexación es manual y requiere mucho tiempo. Este proyecto pretende demostrar que es posible utilizar Natural Language Processing (NLP) y Machine Learning (ML) para automatizar la extracción de datos bibliográficos de documentos y así acelerar el proceso de indexación. El objetivo es entrenar modelos de ML para identificar y extraer información como autor, título, año de publicación, palabras clave, etc. desde estos documentos. En concreto se desarrollaron dos modelos: un modelo de Reconocimiento de Entidades Nombradas (NER) para extraer información desde la carátula de los documentos y un Modelo de Lenguaje Grande (LLM) para extraer palabras clave desde el resumen de los documentos. Palabras clave: Reconocimiento de Entidades Nombradas, Modelo de Lenguaje Grande, Aprendizaje Automático, Procesamiento de Lenguaje Natural, Indexación de Documentos. | es |
| dc.identifier.uri | https://andeanlibrary.org/handle/123456789/36620 | |
| dc.language.iso | es | |
| dc.publisher | Facultad de Ingenieria | |
| dc.relation | https://repositorio.umsa.bo/xmlui/bitstream/123456789/40373/1/PG-9203.pdf | |
| dc.source | Universidad Mayor de San Andrés | |
| dc.subject | MACHINE LEARNING | |
| dc.subject | LENGUAJE NATURAL | |
| dc.subject | REPOSITORIO DIGITAL | |
| dc.subject | EXTRACCIÓN DE DATOS BIBLIOGRÁFICOS | |
| dc.title | Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés. | |
| dc.type | Thesis |