Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.

dc.contributor.advisorPoma Calle, Oscar Marcelo
dc.contributor.authorIturralde Aliaga, Rodrigo Orlando
dc.coverage.spatialBolivia
dc.date.accessioned2026-03-22T12:44:48Z
dc.date.available2026-03-22T12:44:48Z
dc.date.issued2024
dc.description.abstractLa Universidad Mayor de San Andrés (UMSA) está digitalizando sus bibliotecas y creando una biblioteca virtual para almacenar los documentos académicos elaborados por sus estudiantes (proyecto de grado, tesis, etc.). Sin embargo, aún hay miles de estos documentos pendientes de ser indexados y publicados en la biblioteca. El proceso de indexación es manual y requiere mucho tiempo. Este proyecto pretende demostrar que es posible utilizar Natural Language Processing (NLP) y Machine Learning (ML) para automatizar la extracción de datos bibliográficos de documentos y así acelerar el proceso de indexación. El objetivo es entrenar modelos de ML para identificar y extraer información como autor, título, año de publicación, palabras clave, etc. desde estos documentos. En concreto se desarrollaron dos modelos: un modelo de Reconocimiento de Entidades Nombradas (NER) para extraer información desde la carátula de los documentos y un Modelo de Lenguaje Grande (LLM) para extraer palabras clave desde el resumen de los documentos. Palabras clave: Reconocimiento de Entidades Nombradas, Modelo de Lenguaje Grande, Aprendizaje Automático, Procesamiento de Lenguaje Natural, Indexación de Documentos.es
dc.identifier.urihttps://andeanlibrary.org/handle/123456789/36620
dc.language.isoes
dc.publisherFacultad de Ingenieria
dc.relationhttps://repositorio.umsa.bo/xmlui/bitstream/123456789/40373/1/PG-9203.pdf
dc.sourceUniversidad Mayor de San Andrés
dc.subjectMACHINE LEARNING
dc.subjectLENGUAJE NATURAL
dc.subjectREPOSITORIO DIGITAL
dc.subjectEXTRACCIÓN DE DATOS BIBLIOGRÁFICOS
dc.titleAplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.
dc.typeThesis

Files

Collections