Publicación:
Estudio de distancias para datos mixtos para análisis visual de datos multidimensionales

No hay miniatura disponible
Fecha
2019
Autores
Muñoz Salas, Gina Lucia
Título de la revista
Revista ISSN
Título del volumen
Editor
Universidad Católica San Pablo
Proyectos de investigación
Unidades organizativas
Número de la revista
Abstracto
Los datos encontrados en conjuntos reales pueden incluir múltiples tipos de datos, como numéricos y categóricos. Encontrar formas de manejar estos diferentes valores se ha convertido en uno de los objetivos actuales de la investigación en minería y visualización de datos. En este trabajo, se ha estudiado las consecuencias de diferentes medidas de similitud de tipo mixto en mapas visuales de datos multidimensionales. El estudio se centra en analizar el impacto de estas medidas combinándolas con técnicas de proyección multidimensionales conocidas, que con frecuencia son la opción al proporcionar un mecanismo visual para descubrir información en espacios multidimensionales. Se aplicó las métricas coeficiente de silueta, preservación del vecindad y coeficiente de estrés en las proyecciones de nueve conjuntos de datos para evaluar las diferentes medidas de distancia, tanto en términos de segregación como de preservación de la similitud. Además, se presenta un estudio de caso sobre datos urbanos que ilustra la necesidad de confiar en tales medidas. Sobre la base de los análisis, proporcionamos recomendaciones sobre la aplicación de medidas de similitud para conjuntos de datos multidimensionales de tipo mixto en tareas de análisis visual.
Descripción
Palabras clave
Similitud, Datos mixtos, Datos multidimensionales, Proyecciones multidimensionales
Citación