Publicación:
Reconocimiento de palabras en manuscritos históricos basado en aprendizaje online

dc.contributor.author Meza Lovón, Graciela Lecireth es_PE
dc.date.accessioned 2024-05-30T23:13:38Z
dc.date.available 2024-05-30T23:13:38Z
dc.date.issued 2016-07-13
dc.description.abstract En esta tesis se propone un método de reconocimiento online para la transcripción de palabras contenidas en manuscritos históricos. El método propuesto incluye las etapas de: preprocesamiento, que emplea diversas técnicas para segmentar el documento en imágenes de palabras; extracción de características, que extrae información relevante usando, en este caso, características basadas en el gradiente, en particular, magnitud y orientación; y finalmente, el reconocimiento propiamente dicho, donde se concentran las principales contribuciones de esta tesis. En esta última etapa, se propusieron dos extensiones de la SVM-Online: la primera permite que el modelo opere en escenarios con conjuntos de datos de más de dos clases, para lo cual se usa la estrategia \uno contra uno"; la segunda extensión permite que el modelo emita salidas probabilísticas y no solo salidas discretas. Esta última extensión es de vital importancia, ya que posibilita el correcto funcionamiento del Reconocedor Basado en Grafos (RBG). El RBG es otra contribución de esta tesis y tiene la finalidad de evitar la segmentación del documento a nivel de carácter. Para ello, cada imagen a ser reconocida es representada por un grafo direccionado, cuyas aristas están relacionadas a una subimagen y a una probabilidad. En función de esta se estima, para cada arista, un costo que es empleado por el algoritmo Dijkstra Modificado, también propuesto en esta tesis, para emitir la transcripción de la imagen en cuestión. Los experimentos fueron realizados con tres conjuntos de datos: el corpus Ejecutora y Certificación del Escudo de Armas de Apellidos, el corpus Cristo Salvador, y el corpus Doña Germana de Foix. En base a los experimentos realizados, podemos concluir que los resultados obtenidos son satisfactorios en relación a otras propuestas de transcripción de textos presentadas en la literatura.
dc.description.sponsorship Fondo Nacional de Desarrollo Científico y Tecnológico - Fondecyt
dc.identifier.uri https://hdl.handle.net/20.500.12390/333
dc.language.iso spa
dc.publisher Universidad Nacional de San Agustín de Arequipa
dc.rights info:eu-repo/semantics/openAccess
dc.rights.uri http://creativecommons.org/licenses/by/4.0/
dc.subject Reconocimiento de caracteres
dc.subject Manuscrito es_PE
dc.subject.ocde https://purl.org/pe-repo/ocde/ford#1.02.01
dc.title Reconocimiento de palabras en manuscritos históricos basado en aprendizaje online
dc.type info:eu-repo/semantics/doctoralThesis
dspace.entity.type Publication
oairecerif.author.affiliation #PLACEHOLDER_PARENT_METADATA_VALUE#
thesis.degree.discipline Computación y Ciencias de la Información
thesis.degree.grantor Universidad Nacional de San Agustín.Unidad de Post Grado.Facultad de Ingenería de Producción y Servicios
thesis.degree.name Doctor en Ciencias de la Computación
Archivos
Paquete original
Mostrando 1 - 1 de 1
Imagen en miniatura
Nombre:
2016_Meza_Reconocimiento-palabras-manuscritos.pdf
Tamaño:
6.09 MB
Formato:
Adobe Portable Document Format
Descripción:
Paquete de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed to upon submission
Descripción: