Bienvenido al Repositorio Institucional del Concytec

El Repositorio Institucional del Concytec tiene como objetivo permitir el libre acceso a la producción científica institucional, optimizando su visibilidad; así mismo garantizar la preservación y conservación de la información relacionada a la ciencia, tecnología e innovación.

Display.item.jsp


Por favor, utiliza este identificador para citar o enlazar este ítem:
http://hdl.handle.net/20.500.12390/1671


Título: Integración de técnicas de deep learning y algoritmos de aprendizaje multi etiqueta para la Clasificación de Textos
Autor(es): Quispe Poccohuanca, Oscar Edmit 
Asesor(es): Ocsa Mamani, Alexander Victor 
Resumen: En el campo del aprendizaje automático se realizan muchas aplicaciones, como la clasificación y agrupación de datos. La clasificación de datos puede ser de dos tipos: binaria cuando se tienen una clase y multi-clase cuando se tienen más de una clase. Ambos restringen a que una instancia a clasificar pertenezca a una sola clase. Pero en la clasificación de textos es lógico pensar que un texto puede pertenecer a una o más clases. A este tipo de clasificación se le denomina clasificación multi-etiqueta y se encuentra dentro del aprendizaje multi-etiqueta. Sobre este tipo de clasificación los clasificadores binarios o multi-clase tienen dificultades para resolver esto, debido a que restrigen la clasificación a una sola etiqueta. Para afrontar este tipo de clasificación se han propuesto algunas maneras de resolver esto. Algunos autores proponen transformar la clasificación multi-etiqueta en clasificación binaria como el método Binary Relevance (BR). Con este método se pierde la correlación de las etiquetas y a su vez aumenta el tamaño del conjunto de datos de entrenamiento. Otras propuestas que se han realizado son adaptar algoritmos de clasificación binaria o multi-clase como las Máquinas de Soporte Vectorial o Redes Neuronales. Por otro lado, investigaciones recientes utilizan técnicas de deep learning (Aprendizaje Profundo) como son: la Redes Neuronales Convolucionales y Redes Neuronales Recurrentes para la clasificación de textos y oraciones. Por ahora estos solo trabajan con clasificación binaria y multi-clase. Analizando el modelo propuesto por Zhang, el cual es un modelo de clasificación que utiliza una representación de textos a nivel de caracteres y redes neuronales convolucionales como clasificador, se encontró que este modelo tiende a perder información, con lo cual, la precisión del clasificador disminuye. Por otro lado, dentro de los métodos de representación de textos se encuentran varios, uno que llama la atención es la Indexación Semántica Latente. Este método tiene resultados superiores a otros métodos de representación, ya que elimina la polisemia y sinonimia de palabras en los textos. En este trabajo se propone: primero representar los textos mediante Indexación Semántica Latente. Segundo, sobre esta representación utilizar Redes neuronales Convolucionales para la extracción de características, y finalmente aplicarlos sobre bases de datos con textos multi-clase y multi-etiqueta. Los resultados de los experimentos realizados, muestran que el modelo que se propone tiene una alta precisión cuando los textos a clasificar son grandes, mientras que con textos menor cantidad de caracteres el rendimiento del modelo disminuye.
Tema: Redes neuronales;Convolucionales;Clasificación multi etiqueta;Clasificación de textos;Indexación semántica latente
Editorial: Universidad Nacional de San Agustín de Arequipa
Fecha de publicación: 2018
Financiamiento: CONV-000028-2015-FONDECYT-DE 
Tipo de publicación: info:eu-repo/semantics/masterThesis
Identificador Handle: http://hdl.handle.net/20.500.12390/1671
Recurso relacionado: http://repositorio.unsa.edu.pe/handle/UNSA/6422
Nivel de acceso: info:eu-repo/semantics/openAccess
Colección:2.2 Estudios de maestría

Registro Dublin Core completo



Páginas vistas

40
marcado en 25-jun-2022

Google ScholarTM

Check

  • Compartir este item
  • QR Code

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons