Publicación:
Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas
Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas
dc.contributor.author | Copara Zea, Jenny Linet | es_PE |
dc.date.accessioned | 2024-05-30T23:13:38Z | |
dc.date.available | 2024-05-30T23:13:38Z | |
dc.date.issued | 2017 | |
dc.description.abstract | El reconocimiento de entidades nombradas es una tarea relevante en el a´rea de Procesamiento de Lenguaje Natural, su funci´on es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma ingl´es. Recientes estudios en el idioma ingl´es han mostrado que utilizar caracter´ısticas no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si caracter´ısticas no supervisadas pueden mejorar la tarea de NER supervisado en el idioma espan˜ol. Para esto, se propone utilizar caracter´ısticas no supervisadas mediante word representations y colocaciones, as´ı como caracter´ısticas adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utiliza cross-lingual word representations, es comparable a abordajes de aprendizaje profundo, actualmente el estado del arte para NER en español. | |
dc.description.sponsorship | Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica - Concytec | |
dc.identifier.uri | https://hdl.handle.net/20.500.12390/1946 | |
dc.language.iso | spa | |
dc.publisher | Universidad Católica San Pablo | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0/ | |
dc.subject | Word embeddings | |
dc.subject | Procesamiento de lenguaje natural | es_PE |
dc.subject | NER para español | es_PE |
dc.subject | Conditional Random Fields | es_PE |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.01 | |
dc.title | Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas | |
dc.type | info:eu-repo/semantics/masterThesis | |
dspace.entity.type | Publication | |
oairecerif.author.affiliation | #PLACEHOLDER_PARENT_METADATA_VALUE# |