Publicación:
Construcción automática y análisis de modelos de espacios de palabras de n-gramas y su aplicación a tareas de procesamiento de lenguaje natural

Imagen en miniatura
Fecha
2013
Autores
Cornejo Aparicio, Víctor Manuel
Título de la revista
Revista ISSN
Título del volumen
Editor
Universidad Nacional de San Agustín
Proyectos de investigación
Unidades organizativas
Número de la revista
Abstracto
La presente tesis tiene por objetivo mejorar la calidad de vocablos relacionados semánticamente mediante la construcción automática y análisis de Modelos de Espacios de Palabras basados en n-gramas. Este método debe incluir vocablos que a su vez deben mejorar la precisión de tareas de procesamiento de lenguaje natural, específicamente la clasificación de textos, para ello se emplearon modelos ya existentes como base de conceptualización y se implementaron mejoras en el pre-procesamiento de los textos, tales como la extracción de verbos y sustantivos, posteriormente se trabajó la clasificación a tres niveles de n-gramas (monogramas, digramas y digramas ordenados horizontalmente), luego se efectuaron los experimentos con el corpus estandarizado “corpora Reuters 21578”, del cual se seleccionaron las ocho categorías más relevantes con las que se obtuvo un nivel de precisión del orden del 84.17%, con lo que se superó el 83% de precisión prevalente, lo cual permitió validar la propuesta.
Descripción
Palabras clave
Semántica, Lenguaje natural, Reuters
Citación