Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.

Iturralde Aliaga, Rodrigo Orlando

Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.

dc.contributor.advisor	Poma Calle, Oscar Marcelo
dc.contributor.author	Iturralde Aliaga, Rodrigo Orlando
dc.coverage.spatial	Bolivia
dc.date.accessioned	2026-03-22T12:44:48Z
dc.date.available	2026-03-22T12:44:48Z
dc.date.issued	2024
dc.description.abstract	La Universidad Mayor de San Andrés (UMSA) está digitalizando sus bibliotecas y creando una biblioteca virtual para almacenar los documentos académicos elaborados por sus estudiantes (proyecto de grado, tesis, etc.). Sin embargo, aún hay miles de estos documentos pendientes de ser indexados y publicados en la biblioteca. El proceso de indexación es manual y requiere mucho tiempo. Este proyecto pretende demostrar que es posible utilizar Natural Language Processing (NLP) y Machine Learning (ML) para automatizar la extracción de datos bibliográficos de documentos y así acelerar el proceso de indexación. El objetivo es entrenar modelos de ML para identificar y extraer información como autor, título, año de publicación, palabras clave, etc. desde estos documentos. En concreto se desarrollaron dos modelos: un modelo de Reconocimiento de Entidades Nombradas (NER) para extraer información desde la carátula de los documentos y un Modelo de Lenguaje Grande (LLM) para extraer palabras clave desde el resumen de los documentos. Palabras clave: Reconocimiento de Entidades Nombradas, Modelo de Lenguaje Grande, Aprendizaje Automático, Procesamiento de Lenguaje Natural, Indexación de Documentos.	es
dc.identifier.uri	https://andeanlibrary.org/handle/123456789/36620
dc.language.iso	es
dc.publisher	Facultad de Ingenieria
dc.relation	https://repositorio.umsa.bo/xmlui/bitstream/123456789/40373/1/PG-9203.pdf
dc.source	Universidad Mayor de San Andrés
dc.subject	MACHINE LEARNING
dc.subject	LENGUAJE NATURAL
dc.subject	REPOSITORIO DIGITAL
dc.subject	EXTRACCIÓN DE DATOS BIBLIOGRÁFICOS
dc.title	Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.
dc.type	Thesis

Collections

Tesis de Grado

Aplicación de técnicas de machine learning y procesamiento de lenguaje natural para la extracción automática de datos bibliográficos en documentos académicos de la Universidad Mayor de San Andrés.

Files

Collections