UNIVERSIDAD NACIONAL DE SAN AGUSTÍN
ESCUELA DE POSTGRADO.
UNIDAD DE POSTGRADO DE LA FACULTAD DE
INGENIERIA DE PRODUCCION Y SERVICIOS
RECONOCIMIENTO DE PATRONES MEDIANTE REDES
COMPLEJAS
Tesis presentada por el Magister en Ciencias de
Computación y Matemática Computacional: Juan
Carlos Gutiérrez Cáceres
Para optar el grado de Doctor en Ciencia de la Com-
putación.
Asesor: Dr. César Armando Beltrán Castañón
Octubre-2013

A mi familia por todo el
apoyo dado
Agradecimentos
A Dios a mi familia, a mis amigos que siempre estuvieron a mi lado. Juan
Carlos
i
Resumen
La detección de patrones no es una tarea trivial, especialmente cuando se tienen datos heterogé-
neos aún dentro de un dominio específico. En la literatura existe una diversidad de técnicas
para la detección y reconocimiento de patrones, es así que en los últimos años se ha tomado un
especial interés en la técnica de redes complejas, las cuales son representadas como grafos con
gran cantidad de nodos y patrones de conexión no triviales. Sin embargo, no se conoce el po-
tencial de esta estrategia, ni su aplicación a diversos problemas de reconocimiento de patrones,
especialmente si tendrá un comportamiento óptimo para ciertos dominios. En ese sentido, el
presente trabajo propone un modelo basado en redes complejas para el reconocimiento de pa-
trones, el cual ha sido aplicado exitosamente para el reconocimiento de series temporales y de
imágenes digitales. El modelo propuesto lleva a una representación de grafo mediante un algo-
ritmo de transformación, aplicado a series temporales, tomando en consideración el total de la
información, lo cual la diferencia de otras técnicas que extraen sólo parte de la misma. Para el
caso de imágenes, en la literatura se tiene antecedentes del uso separado de la representación
de contorno y del contenido de los objetos en análisis. Nuestro trabajo propone una repre-
sentación conjunta del contorno y el contenido. Como primer caso de estudio, se realizaron
experimentos con un conjunto de secuencias de sonido de vocablos, con el objeto de desarrol-
lar un reconocimiento de habla, siendo que nuestra propuesta consiguió reconocer el 99.44%
los diferentes vocablos probados. Para el reconocimiento de patrones, se experimentó con imá-
genes de la base de datos de parásitos de Helmintos, siendo que el mismo está constituido por 11
especies diferentes con una base de datos de 1036 imágenes, donde nuestra propuesta consiguió
el 98.74% de acierto. Estos resultados son muy superiores a los conseguidos por técnicas tradi-
cionales, lo cual nos indica que el uso de redes complejas para el reconocimiento de patrones
es una técnica muy promisoria, y con el presente trabajo se contribuye a enriquecer no solo la
literatura en el área, sino en la solución de aplicaciones prácticas como las experimentadas..
ii
Abstract
The detection of patterns is not a trivial task, especially when data are heterogeneous even within
a specific domain. In the literature there are a variety of techniques for the detection and pattern
recognition, so that in the last years there is particular interest in the complex networks technic,
which are represented as a graph with nodes and large quantity of patterns nontrivial connec-
tion. However, is not known the potential of this strategy nor its application to various pattern
recognition problems, especially if it will have an optimum performance for certain domains.
In that sense, this thesis proposes a model based on complex networks for pattern recognition,
which has been successfully applied to time series recognition and digital imaging. The pro-
posed model leads to graph representation by a transformation algorithm, applied to time series,
taking into consideration all information, which differentiates from other techniques that using
extracted only part of it. For the case of images, in the literature has a antecedent of use sepa-
rately from the contour representation and content analysis of the objects . Our work proposes
a joint representation of the contour and content analysis. As a first case study, experiments
were tested with a set of sound sequences of words, in order to develop a speech recognition,
being that our proposal achieved 99.44 % of recognize the different words tested. For pattern
recognition, experimented with images database Helminth parasites, being that consists of 11
different species with a database of 1036 images, where our proposal achieved 98.74 % success
rate. These results are much higher than those achieved by traditional techniques, which indi-
cates that the use of complex networks for pattern recognition is a very promising technique,
and the present work not only enriches the literature, but in solving practical applications as
experienced.
iii
Índice
1 Introducción 1
1.1 Contexto y motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Definición del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.1 Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Estructura del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Redes complejas 6
2.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Sistemas complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Red compleja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4 Grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5 Estructura de las redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.6 Modelos de las redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.6.1 Redes aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6.2 Redes mundo pequeño . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.6.3 Redes libre de escalas . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7 Medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.7.1 Medidas relacionadas a la distancia . . . . . . . . . . . . . . . . . . . 16
2.7.2 Medidas relacionadas al agrupamiento y búsqueda de ciclos . . . . . . 18
2.7.3 Grado de distribución . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.7.4 Medidas de centralidad . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.8 Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Reconocimiento de patrones y redes complejas 21
3.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Series temporales y redes complejas . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.1 Series temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.2 Técnicas estadísticas para las series temporales . . . . . . . . . . . . . 23
3.2.3 Análisis de series temporales . . . . . . . . . . . . . . . . . . . . . . 25
3.2.4 Análisis de series temporales mediante representación por redes com-
plejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2.5 Problemática actual en la representación de las señales . . . . . . . . . 28
iv
3.3 Imágenes y redes complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3.1 Textura de una imagen . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3.2 Clasificación de texturas . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3.3 Representación de texturas mediante redes complejas (Wesley, 2010)
(Backes, 2010) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3.4 Contornos de una imagen . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3.5 Métodos para detección de contornos . . . . . . . . . . . . . . . . . . 32
3.3.6 Creación de red compleja a partir de contornos . . . . . . . . . . . . . 32
3.3.7 Situación actual y problemática en la representación de imágenes . . . 33
3.4 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
4 Método propuesto 35
4.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Esquema general de la propuesta . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.3 Propuesta para caracterizar series temporales mediante red compleja . . . . . . 37
4.3.1 Representación de la serie temporal por red compleja . . . . . . . . . . 38
4.3.2 Obtención del vector de características . . . . . . . . . . . . . . . . . . 41
4.4 Propuesta para la caracterización imágenes mediante redes complejas . . . . . 43
4.4.1 Representación de la imagen por red compleja . . . . . . . . . . . . . 43
4.4.2 Obtención del vector de características . . . . . . . . . . . . . . . . . . 46
4.5 Clasificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.5.1 Canonical discriminant analysis (CDA) . . . . . . . . . . . . . . . . . 48
4.5.2 Maquinas de vectores soporte (MVS) . . . . . . . . . . . . . . . . . . 49
4.6 Validación cruzada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.7 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5 Resultados experimentales 54
5.1 Resultados de la aplicación para el reconocimiento de palabras . . . . . . . . . 54
5.1.1 Adquisición, Cuantificación y Muestreo . . . . . . . . . . . . . . . . . 56
5.1.2 Detección de inicio y fin . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.1.3 Extracción de características . . . . . . . . . . . . . . . . . . . . . . . 58
5.1.4 Clasificación de las palabras habladas . . . . . . . . . . . . . . . . . . 58
5.2 Reconocimiento de parásitos helmintos . . . . . . . . . . . . . . . . . . . . . 61
5.2.1 Conjunto de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.2.2 Técnicas de extracción de características . . . . . . . . . . . . . . . . 67
5.2.3 Redes complejas para la clasificación de parásitos . . . . . . . . . . . . 74
5.2.4 Red compleja del modelo propuesto . . . . . . . . . . . . . . . . . . . 75
5.2.5 Clasificación de parásitos . . . . . . . . . . . . . . . . . . . . . . . . . 76
6 Conclusiones 85
6.1 Discusión sobre el modelos propuesto . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
6.3 Recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
6.4 Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Referencias Bibliográficas 88
v
Lista de Figuras
2.1 Red de amigos de un colegio en los Estados Unidos: Dos personas están conec-
tadas si son amigos.Fuente: (Newman, 2003). . . . . . . . . . . . . . . . . . . 8
2.2 Red de contagios entre personas: Dos personas están conectadas si una contagió
de una enfermedad a la otra. Fuente:(http://www.orgnet.com). . . . . . . . . . 9
2.3 Red de contactos sexuales entre individuos: Dos personas están conectadas si
han tenido por lo menos una relación sexual.Fuente: (Keeling and Eames, 2005). 9
2.4 Red de proteínas: Dos proteínas están conectadas si participan en la misma
reacción química. Fuente: (Hidalgo, 2010) . . . . . . . . . . . . . . . . . . . . 10
2.5 Internet: Dos computadoras están conectadas si hay un cable que las conecta.Fuente:
(Watts and Strogatz, 1998b). . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.6 Documentos en un sitio Web: Dos páginas web están conectadas si hay un
hipervínculo de una a la otra.Fuente: (Newman, 2003). . . . . . . . . . . . . . 11
2.7 Red regular cada nodo tiene el mismo numero de conexiones . . . . . . . . . . 14
2.8 (a)Grafo aleatorio de Red Erdos y Renyi (b) distribución de los grados . . . . . 14
2.9 Transición entre red aleatoria a red regular donde el caso intermedio es una red
de con características de pequeño mundo . . . . . . . . . . . . . . . . . . . . . 15
2.10 (a)Red libre de escala (b) Distribución de colectividad de los nodos . . . . . . . 16
3.1 representación de una imagen mediante una malla regular conectada con los 8
vecinos (Wesley, 2010). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2 Creación de diferentes redes a partir de la malla regular (Wesley, 2010). . . . . 31
3.3 Creación de diferentes redes a partir del contorno de una imagen. . . . . . . . . 33
4.1 Esquema general de la propuesta de reconocimiento de patrones mediante redes
complejas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2 Ejemplos de serie temporal correspondiente a la palabra uno. . . . . . . . . . 39
4.3 Ejemplos de serie temporal correspondiente a la palabra dos. . . . . . . . . . . 39
4.4 Ejemplos de redes complejas para diferentes valores de θ en la figura (a) el
valore de θ = 1, (b) el valor de θ = 5, (c) el valor de θ = 10, (d) el valor de
θ = 15. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.5 Imagen como una superficie 3D en diferentes ángulos. . . . . . . . . . . . . . 44
4.6 Representación de los vertices de una imagen del cerebro. . . . . . . . . . . . 45
4.7 Efecto de diferentes umbrales para establecer las aristas. . . . . . . . . . . . . 46
vi
4.8 Representación de diferentes texturas, se puede apreciar que las redes son difer-
entes, manteniéndose las diferencias entre las cuatro texturas diferentes . . . . . 47
4.9 Caso linealmente separable . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.10 Caso no linealmente separable . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.1 Gráfica de las amplitudes de las palabras grabadas: En la figura(a) son nueve
palabras diferentes; el numero Uno, Dos, Tres, Cuatro, Cinco, Seis, Siete, Ocho
y Nueve; En la figura (b) Muestras de una misma palabra pueden ser vistas . . 55
5.2 Determinación de ventanas solapadas para la detección del inicio y fin de pal-
abra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.3 Determinación de ventanas solapadas para la detección del inicio y fin de pal-
abra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.4 Redes construidas para diferentes distancias . . . . . . . . . . . . . . . . . . . 59
5.5 Relación entre las diferentes variables canónicas . . . . . . . . . . . . . . . . . 60
5.6 Imágenes de la base de datos SADPI8 v2.0 . . . . . . . . . . . . . . . . . . . 64
5.7 Nombres de parásitos: 1) Ascaris 2) Uncinarias 3) Trichuris trichuria 4) Hy-
menolepis nana 5) Dyphillobothrium pacificum 6) Taenia solium 7) Fasciola
hepática 8) Enterobius vermicularis . . . . . . . . . . . . . . . . . . . . . . . 65
5.8 Muestra de imágenes de diferentes parasitos de la base de datos usada para la
clasificación de parásitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.9 Propuesta para la clasificación de los parásitos Helmintos . . . . . . . . . . . . 79
5.10 Contornos externos e internos de los diferentes parásitos . . . . . . . . . . . . 80
5.11 Imagen micrográfica del parásito también se puede ver su visualización en 3D,
y dos redes generadas para dos parametros distintos cuando la distancia vale 4
y cuando vale 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.12 Enterobius Vermiculares con problemas de transformaciones geométricas, se
puede ver que su vector de características para las diferentes transformaciones
geométricas son muy parecidas eso hace al método robusto ante problemas de
rotación y escala, (a) Reducida de tamaño al 50% del tamaño original, (b) Im-
agen Original, (c) Aumentada de tamaño al 150 %, (d) Imagen rotada y au-
mentada 150 %, (e) Imagen normal rotada, (f) Imagen rotada y disminuida de
tamaño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.13 Análisis de las variables canónicas se pueden ver la combinación de la 8va
variable combinada con la 7ma, 6ta, 5ta, 4ta, 3ra, 2da, 1ra. Y 3ra combinada
con las variables 2da, 1ra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.14 Visualización de la variable 7ma con la 6ta, 5ta, 4ta, 2da, 1ra variable. También
vemos la 4ta y 3ra, 2da, 1ra. Además la 6ta combinada con 5ta, 4ta, 2da, 1ra
finalmente la 5ta variable combinada con 4ta, 3ra, 2da, 1ra . . . . . . . . . . . 84
vii
Lista de Tablas
5.1 Comparación de los resultados para diferentes parámetros del modelo propuesto. 61
5.2 Matriz de confusion, cons sus respectivos error por cada clase, usando SVM
con kernel lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.3 Matriz de confusion, cons sus respectivos error por cada clase, usando SVM
con kernel polinomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.4 Cantidad de micrografías por especie y parásitos segmentados encontrados en
las micrografías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.5 Comparación de los resultados para diferentes parámetros del modelo propuesto. 77
5.6 Comparación de los resultados para diferentes parámetros del modelo propuesto. 77
5.7 Matriz de confusion, con sus respectivos error por cada clase de la clasificación
del método propuesto a los 8 especies de parásitos helmintos. . . . . . . . . . . 78
5.8 Matriz de confusion, cons sus respectivos error por cada clase, para el modelo
basado en contornos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
viii
CAPÍTULO
1
Introducción
1.1 Contexto y motivación
En la actualidad podemos apreciar diferentes tecnologías emergentes que nos ayudan a resolver
problemas reales, muchas de estas tecnologías son fruto de las denominadas ciencias comple-
jas, donde técnicas como la teoría del caos, redes complejas son utilizadas como una nueva
alternativa de solución a muchos problemas tradicionales e incluso en ingeniería (Costa et al.,
2007).
Una de estas tecnologías que esta tomando mucha importancia es el campo de las redes
complejas. Este area de investigación surge inicialmente por el interés de entender a las difer-
entes redes que existen en la naturaleza, por ejemplo el cerebro está compuesto de más de cien
mil millones de neuronas, se dice que cada neurona tiene entre diez mil a quince mil conexiones
(sinapsis), eso quiere decir que tenemos billones de sinapsis, es por ese motivo que el cerebro es
uno de las redes complejas mas representativas. Existen diferentes estudios han venido siendo
desarrollados sobre el cerebro, ya que en él se llevan a cabo una serie de actividades neuronales
y procesos cognitivos complejos, que el ser humano aun no consigue descifrar del todo (Boc-
caletti et al., 2006). Trabajos como el de Rubinov (Rubinov and Sporns, 2010) analiza el nivel
de conectividad del cerebro como una red compleja, mediante el uso de diferentes métricas las
cuales son muy usadas en el análisis de las redes en general.
1
1.1. CONTEXTO Y MOTIVACIÓN 2
Existen muchos fenómenos en la naturaleza que también pueden ser modelados como re-
des complejas, como por ejemplo: las redes biológicas (los enlaces de las proteínas), las redes
de comunicación física como internet, las redes sociales, las redes epidemiológicas, las redes
ecológicas, las redes de distribución eléctrica (Pagani and Aiello, 2013) etc; las redes se en-
cuentran en todas partes. Es por ese motivo que estudiar las redes complejas se ha convertido
un área de investigación activa, el cual esta inspirado por el análisis empírico de las redes del
mundo real (Ravasz and Barabási, 2003).
Al inicio, el estudio de las redes complejas estuvo encomendado principalmente a físicos e
estadísticos, pero fueron necesarios modelos matemáticos y otras herramientas más poderosas,
para poder entender y explicar las propiedades estructurales y dinámicas de las redes, y así se
fueron incrementandose otras áreas de investigación entre ellas: medicina, economía, biología,
y ahora la ciencia de la computación (Reijneveld et al., 2007), la cual permite implementar
herramientas para poder simular y realizar experimentos sobre diferentes modelos propuestos
Las redes en general poseen diferentes tamaños y complejidades y también tienen propiedades
de similares en su estructura, las que pueden ser modelados desde un contexto de teoría de
grafos, siendo representados en términos de nodos y aristas (conexiones entre nodos), con car-
acterísticas topológicas no triviales, es decir, donde la distribución de sus conexiones no son ni
regulares puros ni aleatorios (Boccaletti et al., 2006).
Hoy en día esta área de investigación está ayudando a resolver diferentes problemas, por
ejemplo en la representación de redes sociales tenemos el trabajo de (Marina and Carlos, 2010)
donde se modela la red social Twitter y se analiza su estructura y algunas propiedades de dicha
red, en el procesamiento de lenguaje (Pardo et al., 2006) lo uso para evaluar la calidad de
redacción de textos, en (Amancio et al., 2012) se usan las redes complejas para resumir textos,
también en el reconocimiento de patrones vemos que existen trabajos para modelar las series
temporales en grafos de tal manera que la dinámica de los sistemas pueden ser analizados desde
el punto de vista topológico, como lo hizo (Zhang and Small, 2006) el cual modelo los sistemas
dinámicos en redes complejas usando la correlación, otro trabajo modelo la actividad sísmica
de diferentes lugares de la tierra (Davidsen et al., 2005) (Ferreira et al., 2013).
Muchos han propuestos diferentes métodos de construcción de redes complejas a partir de
series temporales, trabajos como el de (Dellnitz et al., 2006) el cual está basado en la partición
del espacio de fase de un sistema dinámico en k conjuntos disjuntos, transformando las trayec-
torias en una secuencia de nodos usados para detectar las diferentes transiciones que una serie
temporal pueda tener, puesto que las series temporales reales pueden tener ruido entonces él usa
un umbral para poder realizar las particiones del espacio. También tenemos el trabajo de (Zhang
et al., 2008) que propuso modelar la red mediante el coeficiente de correlación en búsqueda de
ciclos pseudo periódicos. Otro trabajo muy usado es el de (Lacasa et al., 2008) que mediante
1.2. DEFINICIÓN DEL PROBLEMA 3
el concepto de visibilidad de estados crea la red compleja a partir de una serie temporal. Como
se pudo apreciar muchos trabajos están siendo desarrollados para estudiar las series temporales
desde el enfoque de redes complejas.
Las redes complejas también vienen siendo usadas para caracterizar imágenes de tal manera
que esta pueden detectar e identificar objetos dentro de las mismas, el trabajo que propone
(Fabricio, 2010) muestran aplicaciones en segmentación de imágenes , otros trabajos también
han sido desarrollados para poder como el de (Backes et al., 2010) que muestra el uso de la
textura para modelar una red y luego caracterizarla. También existen trabajos en los cuales la
forma de los objetos contenidos en una imagen son el punto principal para modelar la red como
lo muestra el trabajo de (Backes et al., 2009) el cual lo uso para clasificar hojas por su forma.
1.2 Definición del problema
El problema principal es representar un patron mediante una red compleja para posteriormente
caracterizarla y reconocerla, cuando quiere trabajar en esta area se tiene que considerar el tipo
de patron a tratar, ya que de una buena representación dependerá el éxito del reconocimiento,
el problema se complica desde el momento que se quiere trabajar con patrones de series tem-
porales (1D) e imágenes (2D). En ese sentido el modelo propuesto debe ser robusto ante estos
dos tipos de patrones.
En la actualidad existe muchas técnicas para modelamiento de redes complejas a partir de
series temporales, pero están principalmente orientadas a mantener ciertas propiedades de su
dinámica, mas no son propuestas para ser usadas en el reconocimiento de las mismas. Dichas
propuestas tienen diferentes problemas como: pérdida significativa de información, mientras
que otros son orientados a series específicas como series pseudo aleatorias, por otro lados ex-
isten métodos donde se busca una correlación de un segmento de ciclo que se esté repitiendo
en la señal, donde el problema principal es la dimensión del ciclo que se busca, otras técnicas
construyen redes según el grado de visibilidad entre los diferentes estados confundiendo series
determinísticas con series aleatorias.
Por otro lado cuando se quiere trabajar con imágenes, se necesita que el modelo mantenga
las propiedades que las imágenes, por ejemplo caracterizar la forma de los objetos así como la
textura que posee en un solo modelo ya que existen básicamente tendencias de varios autores
que usan las propiedades por separado, hay modelos orientados solo a la representación de la
forma de los objetos no tomando en cuenta la textura de la imagen, y también existen mode-
los que solo usan la propiedad de la textura dejando de lado la forma en ese sentido pierden
información inherente a la imagen por tratar por separado dichas características.
1.3. OBJETIVOS 4
En el capitulo 3 se presentara mayor detalle de las técnicas existentes tanto para series
temporales como para imágenes analizando detalladamente las ventajas y limitaciones de cada
propuesta.
1.3 Objetivos
El objetivo general de esta tesis es proponer un nuevo modelo de representación de red compleja
para el reconocimiento de patrones, específicamente para reconocimiento de palabras (1D) y
reconocimiento de imágenes (2D).
1.3.1 Objetivos específicos
• Proponer una forma de modelamiento de red compleja a partir de series temporales;
• Proponer un modelo de representación de red compleja a partir de imágenes;
• Seleccionar las medidas más adecuadas para las redes complejas creadas;
• Probar las técnicas en reconocimiento de palabras y en el reconocimiento de imágenes de
parásitos helmintos.
1.4 Estructura del documento
Este documento esta estructurado de a siguiente manera:
• En el capítulo 2 se presentan los conceptos básicos referentes a las redes complejas, donde
la teoría de grafos es una parte importante además de las medidas mas usadas serán de-
scritas
• En el capítulo 3 describiremos el estado del de las técnicas para modelar redes com-
plejas a partir de series temporales, comparando y analizando las ventajas y desventa-
jas de los modelos existentes, de igual manera se hará con los modelos existentes en el
reconocimiento de imágenes, analizando las limitaciones de los modelos actuales exis-
tentes.
• En el capítulo 4 se explicara la propuesta para el reconocimiento de patrones mediante re-
des complejas, acá se presentara el modelo propuesto y las ventajas que tiene con respecto
a otros modelos.
1.4. ESTRUCTURA DEL DOCUMENTO 5
• En el capítulo 5 Las pruebas y resultados de ambos casos de estudio serán presentadas
analizando las ventajas de las propuestas
• Finalmente las conclusiones, recomendaciones y trabajos futuros serán presentados
CAPÍTULO
2
Redes complejas
2.1 Consideraciones iniciales
Definir una red compleja no es sencillo, ya que por ser un campo emergente de investigación
es que esta intentando ordenarse según las diferentes investigaciones que se vienen realizando
actualmente no existe una definición formal ya que redes complejas están presentes en difer-
entes areas de investigación. Muchos fenómenos de la naturaleza se puede modelar como una
red, como las estructuras del cerebro, la proteína-proteína redes de interacción, las interacciones
sociales y el Internet y la WWW. Todos estos sistemas pueden ser representados en términos
de nodos y aristas que indican las conexiones entre los nodos. En Internet, por ejemplo, los
nodos representan los routers y las aristas representan las conexiones físicas entre ellos. De la
misma manera, en las redes de transporte, los nodos pueden representar a las ciudades y las
aristas representan las carreteras que los conectan. Estas aristas pueden tener pesos, que puede
representar el flujo de trafico en una autopista o una frecuencia en el caso de palabras pueden
corresponder a la ocurrencia dos palabras en un texto.
Una característica importante de estas redes es que no son aleatorias, pero tienen una ar-
quitectura estructurada. Todo eso se puede apreciar en la topología ya que son diferentes
topologías, por ejemplo las redes de interacción de proteína a proteína e de Internet, son pare-
cidas: siguen la ley de potencia, exhibiendo una estructura libre de escala. Por lo tanto, una
cuestión importante se plantea: ¿Cómo pueden los sistemas fundamentalmente diferentes como
6
2.2. SISTEMAS COMPLEJOS 7
las células y el Internet tener las mismas características topológicas subyacentes?. Encontrar las
leyes fundamentales que generan estas redes seria la respuesta a esta pregunta, por ese motivo
el modelado y la caracterización de ellos son los desafíos actuales en la investigación de redes
complejas.
2.2 Sistemas complejos
Como ocurre con gran parte de estudios científicos, no se puede definir los sistemas complejos
en un sólo enunciado, a continuación se enumeran las características, que para (Aldana and
Cluzel, 2003) son las más importantes:
• Los Sistemas Complejos, son sistemas que están compuestos por muchos elementos no
idénticos, conectados bajo diversas interacciones entre si.
• La complejidad se les atribuye a estos sistemas por que poseen propiedades no esperadas,
ya que presentan comportamientos emergentes, es decir, que emergen de las interacciones
de las partes del sistema.
• Cada parte tiene su propia estructura interna y cada uno tiene una función específica, por
ello para describir un sistema complejo hace falta no solo conocer el funcionamiento de
las partes sino conocer como se relacionan entre sí. Examinar una única neurona no es
suficiente para describir el cerebro.
• Lo que ocurra a una parte del sistema afecta de manera altamente no lineal a todo el
sistema. Ejemplos de sistemas complejos son los seres vivos y las sociedades.
2.3 Red compleja
Diversos sistemas están estructurados como elementos que se interrelacionan entre sí (Barabasi
and Crandall, 2003). Existen muchos sistemas físicos que son un ejemplo claro de estos ele-
mentos interrelacionados como internet, la red física mas grande del mundo. Este tipo de redes
hoy en día son ampliamente estudiados todo dado que el estudio de esta interacción puede en-
contrar comportamiento peculiares (Albert et al., 2000). El estudio de estas redes complejas se
enmarca dentro de los sistemas complejos.
Para poder entender una red compleja es importante recordar algunos conceptos sobre teoría
de grafos, es por ese motivo que en la siguiente sección se presentaran algunos conceptos nece-
sarios sobre grafos para poder caracterizar a estas redes. A lo largo del presente trabajo, se han
2.3. RED COMPLEJA 8
mencionado diferentes ejemplos de redes complejas a continuación comentaremos algo sobre
dichas redes las cuales se podrán ver en las siguientes figuras:
En la figura 2.1 se puede apreciar la red de amigos de un colegio en los Estados Unidos
donde 2 personas están conectadas si son amigos, puesto que esta red se armo preguntando a
los participantes si determinada persona es o no su amigo este podría responder que si mientras
que podría no ocurrir de forma inversa, ya que el otro participante podría decir que no lo es por
ese motivo este grafo es dirigido, los colores de los nodos representan las distintas razas que
existen entre los participantes, y la division entre la parte superior e inferior es realizada entre
colegio primario y secundarios (Newman, 2003).
Figura 2.1: Red de amigos de un colegio en los Estados Unidos: Dos personas están conectadas
si son amigos.Fuente: (Newman, 2003).
Funcionarios de salud pública realizan el seguimiento de contactos para trazar la propa-
gación de enfermedades infecciosas. La red que muestra en la figura 2.2 muestra la propagación
de una enfermedad infecciosa en el aire. El mapa fue creado a partir de datos reales de contacto
de la comunidad en la que el brote estaba sucediendo. Los nodos negros son personas con la
enfermedad clínica (y son potencialmente infecciosos), los nodos de color rosa representan a las
2.3. RED COMPLEJA 9
personas expuestas con la incubación de la infección y no son contagiosas, verde representan
las personas expuestas sin infección y no son contagiosas. Como se pudo apreciar es importante
el mapeo de una infección para poder realizar estudios de como una infección se propaga.
Figura 2.2: Red de contagios entre personas: Dos personas están conectadas si una contagió de
una enfermedad a la otra. Fuente:(http://www.orgnet.com).
De forma similar se pueden apreciar otros aspectos por ejemplo en la figura 2.3 en la cual
se puede apreciar los contactos sexuales entre personas este grafo fue generado de información
registrada de pacientes con VIH, donde una conexión significa que por lo menos esas dos per-
sonas tuvieron una relación sexual también se puede apreciar que existen nodos que son lo que
tienen mas conexiones siendo uno de ellos focos infecciosos.
Figura 2.3: Red de contactos sexuales entre individuos: Dos personas están conectadas si han
tenido por lo menos una relación sexual.Fuente: (Keeling and Eames, 2005).
Para cualquier compleja red es importante saber las propiedades de dicha red, y como es
que estas se generan, esos modelos se han usado para mapear la interacción de las proteínas que
2.3. RED COMPLEJA 10
conforman la levadura Saccharomyces cerevisiae. A nivel biológico también se pueden tener
redes como la que se aprecia en la figura 2.4 donde dos proteínas estas conectadas si participan
de la misma reacción química.
Figura 2.4: Red de proteínas: Dos proteínas están conectadas si participan en la misma reacción
química. Fuente: (Hidalgo, 2010)
El ejemplo de red mas grande es de internet donde se puede ver como las computadoras
pueden estar conectadas físicamente mediante un cable en la figura 2.5 podemos apreciar la
conexión física de Internet.
Figura 2.5: Internet: Dos computadoras están conectadas si hay un cable que las conecta.Fuente:
(Watts and Strogatz, 1998b).
En la figura 2.6 podemos ver las interconexiones de los hipervinculos entre páginas web,
dos páginas están conectadas si existe un hipervinculo que los une.
2.4. GRAFOS 11
Figura 2.6: Documentos en un sitio Web: Dos páginas web están conectadas si hay un hiper-
vínculo de una a la otra.Fuente: (Newman, 2003).
Como se pudo apreciar existen muchos trabajos en los cuales las redes complejas aparecen
como ejemplo de modelamiento, ya sea de fenómenos sociales, como biológicos, e incluso de
como el ser humano extendió sus redes en esta gran red denominada internet.
Para poder formalizar los diferentes conceptos de las redes complejas es necesario apoyarse en
conceptos matemáticos por ese motivo es que a continuación describiros algo de la teoría de
grafos ya que es la indicada para poder expresar de manera formal los conceptos sobre la teoría
de grafos.
2.4 Grafos
Las redes complejas en este contexto son representados por conjuntos de nodos denominados
vértices los cuales están conectados, esta conexión representa la interacción que se tiene entre
nodos los cuales son denominados aristas.
Un grafo G = (V,E) es un objeto abstracto formado por el conjunto de vértices V (nodos)
y el conjunto E de aristas (enlaces) que se unen (de conexión) en pares de vértices. El conjunto
de vértices y un conjunto aristas de un grafo G se denota por V (G) y E(G), respectivamente.
La cardinalidad de V por lo general, se denota por n, y la cardinalidad de E se denota por m. Si
dos vértices están unidos por una arista ellos son llamamos de adyacentes o también pueden ser
denominados como vecinos. Los Grafos pueden ser no dirigidos o dirigidos. En los grafos no
dirigidos, el orden de los vertices unidos por una arista no tienen un orden en particular la cual
es considera como simétrica. Una arista no dirigida uniendo los vértices u, v ∈ V se denota por
u, v = v, u. en grafos dirigidos, cada arista dirigida tiene un origen y un destino. Una arista con
2.5. ESTRUCTURA DE LAS REDES COMPLEJAS 12
origen u ∈ V y destino v ∈ V está representada por el par ordenado (u, v) el cual es distinto de
(v, u).
Llamaremos a todos los nodos que estén conectados directamente a un nodo vi como vecinos
de vi. El número ki vecinos del nodo vi (número de conexiones de vi) se denomina grado de
conectividad de vi.
En lo que corresponde a grafos existe el denominado grafo regular, el cual es aquel que en
todos los nodos tiene un mismo grado de conectividad, así un grafo irregular es aquel que posee
nodos con diferentes grados de conectividad. Un grafo altamente irregular es caracterizado por
el hecho de que cada uno de sus vértices o nodos es adyacente a vértices de grados diferentes
entre sí.
En ese sentido las redes complejas son definidas como redes cuyos vértices pueden presentar
diferentes grados entre si. Nótese que la definición indica que no necesariamente todos los
nodos deben estar conectados unos con otros, ni que todos los nodos deben tener conexiones,
es decir, pueden existir nodos aislados.
A continuación Franceshi (de Angelis André, 2005) hace hincapié en los siguientes algunos
puntos que son tomados en consideración para decir si una red es compleja o no, el tamaño de
la red no será determinante para la clasificación de la red en regular o compleja. En las redes
complejas no es prevista la existencia de conexiones. Las redes regulares son consideradas
casos particulares de redes complejas. Es decir, el conjunto de las redes complejas contiene al
subconjunto de las redes regulares. Es por ese motivo que es importante estudiar la estructura
de las mismas.
2.5 Estructura de las redes complejas
Dado que la red compleja esta formada de nodos y aristas es que el estudio de su estructura esta
relacionado a la interrelación que tienen estos elementos en la red, siendo el interés determinar
las propiedades estructurales de la red, estas propiedades se basan en el estudio de las siguientes
características:
La distribución de conexiones P (k): Es la probabilidad de que un nodo escogido al azar
tenga k conexiones. Por ejemplo, en una red de contactos sexuales P (k) es la probabilidad
de que una persona escogida al azar en una sociedad haya tenido k parejas sexuales distintas
a lo largo de su vida. El coeficiente de agregación C: Es la probabilidad de que dos nodos
conectados directamente a un tercer nodo, estén conectados entre sí. Por ejemplo, en una red
de amistades, es la probabilidad de que dos amigos sean ellos mismos amigos uno del otro. La
longitud mínima Lij entre dos nodos vi y vj : Es el número mínimo de “saltos” que se tienen
2.6. MODELOS DE LAS REDES COMPLEJAS 13
que dar para llegar de un nodo vi de la red a otro nodo vj de la red. La longitud promedio de la
red L: Es el promedio de las longitudes mínimas Lij entre todas las posibles parejas de nodos
(vi, vj) de la red. La distribución de tamaños de islas P (s): Es la probabilidad de que una isla
esté compuesta por s nodos. El tamaño de la isla más grande la que denotaremos por S∞. El
grado de un vértice es también importante: Aquellos nodos con un grado alto en relación de los
demás son llamados hubs, y su presencia en la red tiene una gran influencia en su estructura.
Una importante característica de las redes complejas es que no son aleatorias, si no al contrario
poseen una arquitectura estructurada.
Para Aldana (Aldana, 2006) el estudio general de las redes puede dividirse en dos campos
diferentes: Estructura y Dinámica. En el campo de estructural se está interesado en conocer
la distribución de las conexiones o vecinos, el coeficiente de agregación que es la probabilidad
de que dos nodos conectados a un tercer nodo, estén conectados entre si, también será posible
evaluar la longitud mínima entre dos nodos, longitud promedio, entre otros. Una vez que se sabe
de qué manera interactúan los nodos (propiedades estructurales) en la red, se hace necesario
estudiar sus propiedades dinámicas, como por ejemplo la propagación.
2.6 Modelos de las redes complejas
Antes de comenzar hablar de los diferentes modelos de redes complejas es importante tomar en
consideración a las redes regulares las cuales son uno de los modelos mas conocido de redes,
donde los vertices poseen un posición bien definida en el espacio euclideano y la distribución de
las aristas son distribuidas entre los vecinos topológicos de cada vértice. En la siguiente figura
2.7 podemos apreciar la topología de una red donde se puede apreciar que cada nodo tiene una
cantidad igual de conexiones, sobre la variación o diferencias con las redes regulares es que las
otras redes aumentan su complejidad en el estudio de la mismas por eso los siguientes modelos
difieren de una red regular en la complejidad de sus conexiones.
Existen varios modelos de redes complejas han sido propuestas algunos de esos modelos
son de gran interés es por eso que es importante estudiarlos se pueden diferenciar los siguientes
modelos:
1. Redes aleatorias
2. Redes mundo pequeño
3. Topología libre de escala
2.6. MODELOS DE LAS REDES COMPLEJAS 14
Figura 2.7: Red regular cada nodo tiene el mismo numero de conexiones
2.6.1 Redes aleatorias
Este tipo de redes fueron Erdos y Renyi (P. and A., 1959) los que propusieron una red de
este tipo, donde no existen criterios que privilegien las conexiones, las cuales están dadas por
simple probabilidad así la red es caracterizada por el numero de vertices n y la probabilidad de
conexión p entre los vertices, con un valor n y la conectividad media fija a la distribución de
Poison, la media de los caminos tienden a valores pequeños como se puede apreciar en la figura
2.8
Figura 2.8: (a)Grafo aleatorio de Red Erdos y Renyi (b) distribución de los grados
Las aplicaciones de este modelo son muy limitadas debido a que pocas redes reales se com-
portan tal (no son aleatorias), sin embargo existen aproximaciones en la teoría de redes com-
plejas en el campo de las redes sociales (redes de afiliación y grafos bipartitos). Una diferencia
clara entre las redes reales y las generadas por este modelo se distinguen en la distribuciones
de grado, que en el caso de las generadas por este modelo son poisonianas, mientras que en la
realidad tienden a ser más exponenciales. En las redes con distribuciones poisonianas se con-
2.6. MODELOS DE LAS REDES COMPLEJAS 15
centra la probabilidad en torno a un valor de k (grado del nodo) y decrece a una razón de 1/k
cuando se aleja del valor central. En las redes exponenciales no existe un valor preferente y la
probabilidad decae a lo largo del espectro de k a medida que éste crece.
2.6.2 Redes mundo pequeño
Watts et al (Watts and Strogatz, 1998a), observaron que en algunas redes del mundo real en-
contraron caminos cerrados con apenas 3 nodos los cuales son diferentes de la definición de
las redes aleatorias. Se observaron que dichas redes estaban altamente “clusterizada” al igual
que las redes regulares mientras que la distancia media entre cualquiera de las unidades que la
forman es mucho mas pequeña que en una red regular y muy cercana a una red completamente
aleatoria, pero hay que recordar que en una red aleatoria la clusterización es muy baja debido
precisamente a que no hay un grado de afinidad importante para establecer las conexiones. Y
esas eran precisamente las redes que normalmente habían sido consideradas por los físicos para
modelizar sistemas dinámicos complejos, o bien redes aleatorias o redes regulares. De esta
manera es que se introduce un modelo al que llamaron de “mundo pequeño”, es por ese motivo
que se necesita una manera diferente de crear redes para poder representar ese efecto real que
tenían ciertas redes, este tipo de redes tenían lo que se conoce como el efecto mundo pequeño
dado que a distancia de separación entre vertices crece en un regimen logarítmico. Es por ese
motivos que (Watts and Strogatz, 1998b) propusieron un modelo simple para crear redes con
características de tener valores bajos entre la distancia entre vertices. La siguiente figura 2.9
muestra la red de mundo pequeño.
Figura 2.9: Transición entre red aleatoria a red regular donde el caso intermedio es una red de
con características de pequeño mundo
2.6.3 Redes libre de escalas
Este tipo de redes son aquellas que presentan ciertos nodos que tienen la mayor concentración
de conexiones con los demás. (Barabási et al., 2000) propusieron la construcción de un modelo
2.7. MEDIDAS 16
donde existían ciertos vertices llamados referenciales los cuales tiene la característica de tener la
mayor cantidad de conexiones y el resto de vertices se caracterizan por tener pocas conexiones
normalmente están conectados con el otro tipo de vertices. En la siguiente figura 2.10 se puede
apreciar este tipo de redes:
Figura 2.10: (a)Red libre de escala (b) Distribución de colectividad de los nodos
Es importante notar que existen varios modelos de redes complejas porque ellas presentan
características que en cierta forma las hacen una distinta de la otra, estas características son
cuantificables (medibles) lo cual es importante para diferenciar un modelo de otro.
2.7 Medidas
Existen varias medias que pueden ser consideradas en la caracterización de las redes complejas,
varias de ellas están relacionadas ya que tienen características similares, por ejemplo tenemos
métricas relacionadas a la distancia, relacionadas a la búsqueda ciclos, grado de distribución de
nodos y correlación, redes con diferentes tipos de vertices, medidas de centralidad entre otras a
continuación presentaremos algunas medidas que son importantes para caracterizar una red.
2.7.1 Medidas relacionadas a la distancia
En diferentes casos es importante caracterizar a la red mediante medidas de distancia entre no-
dos, por ejemplo en aplicaciones de rutas cortas entre diferentes caminos, o ver grados promedio
de distancias de un nodo dado hacia todos los demás, existen algunas medidas que nos ayudan
a interpretar a la red en función de sus medidas (Costa et al., 2007).
2.7. MEDIDAS 17
2.7.1.1 Distancia promedio
Se puede definir una medida de la red calculando el valor medio de dij , conocida como la
distancia geodésica promedio:
1 ∑
` = dij (1)
N(N − 1)
i 6=j
Un problema con esta definición es que diverge si hay vértices no conectados en la red. Para
evitar este problema, sólo los pares de vértices conectados se incluyen en la suma. Esto evita
la divergencia, pero introduce una distorsión de las redes que tienen pares de vertices no rela-
cionados, ya que para estos casos esta medida mostrará un valor de distancia media bajo y seria
un error ya que esto se espera sólo para redes con un alto número de conexiones. Latora y Mar-
chiori (Latora and Marchiori, 2001) propusieron una medida estrechamente relacionado que se
llama eficiencia global:
1 ∑ 1
E = (2)
N(N − 1) d
6 ij
i=j
Esta medida cuantifica la eficiencia de envío de información entre un par de nodos de la red,
suponiendo que la eficiencia para el envío de información entre dos vértices i y j es proporcional
a la inversa de su distancia. El recíproco de la eficiencia global es la media armónica de las
distancias geodésicas:
1
h = (3)
E
La determinación de distancias más cortas en una red sólo es posible con la información global
sobre la estructura de la red. La distancia efectiva entre dos vértices en general es mayor que la
distancia más corta, y depende del algoritmo utilizado para recorrer la estructura de la red.
2.7.1.2 Vulnerabilidad
En redes como la World Wide Web, Internet, suministro de energía, etc es importante saber que
los componentes (vértices o aristas) son cruciales para su mejor funcionamiento. Los vértices
críticos de una red son considerados como los principales normalmente vértices con mayor
grado, sin embargo, hay situaciones en las que no necesariamente es el más vital para el fun-
cionamiento del sistema. Por ejemplo, todos los vértices de una red en forma de un árbol binario
tiene el mismo grado, por lo tanto no hay ningún centro, pero la desconexión de uno de los vér-
tices más cercano a la raíz y la raíz misma tiene un impacto mayor que la de los que cerca de
las hojas. Esto sugiere que las redes tienen una propiedad jerárquica, lo que significa que los
componentes más cruciales son aquellas en las posiciones más altas en la jerarquía.
Una manera de encontrar los componentes críticos de una red es mediante la búsqueda de
los vértices más vulnerables. La vulnerabilidad de un vértice se puede definir como la caída en
2.7. MEDIDAS 18
el rendimiento cuando el vértice y todos sus aristas se eliminan de la red:
E − Ei
Vi = (4)
E
donde E es la eficiencia global de la red y Ei es la eficiencia después de remover el vértice i. y
la medida de vulnerabilidad global de una red estará dada por:
V = maxVi (5)
i
2.7.2 Medidas relacionadas al agrupamiento y búsqueda de ciclos
Una de las características del modelo de Erdos-Rényi es que la estructura local de un vértice
tiende a ser como un árbol, donde la probabilidad de que existan ciclos en una red depende
del tamaño de la misma, entre mas cantidad de nodos mas probabilidad de existencia de ciclos
y agrupamientos. Cada vertice pose una cantidad asociada que mide el nivel de conectividad
entre sus vecinos el coeficiente es definido por:
2eu
Cu = (6)
ku(ku − 1)
donde eu representa el numero de conexiones compartidas entre los vecinos del vértice u, el
valor de este coeficiente varia entre [01]
2.7.2.1 Coeficiente de agrupamiento
Una forma de caracterizar la presencia de ciclos es a través del coeficiente de agrupamiento.
Dos coeficientes de agrupamiento diferentes se utilizan con frecuencia. La primera, también
conocida como transitividad (Newman, 2001), se basa en la siguiente definición:
3N4
C = (7)
N3
donde N4 es el número de triángulos en la red y N3 es el numero de conexiones triples. Esto
represente el coeficiente de consistencia para medir cuantos conjuntos de tres diferentes conec-
tados son diferentes de un triángulo. Un triángulo es un conjunto de tres vértices con aristas
entre cada par de vértices; un triple es un conjunto de tres vértices donde cada vértice se puede
llegar el uno del otro (directa o indirectamente), es decir, dos vértices debe estar adyacente a
otro vértice (el vértice central).
2.7. MEDIDAS 19
2.7.2.2 Coeficiente de ciclos
Kim y Kim (Kim and Kim, 2005) definen un coeficiente de ciclo para medir qué tan cíclica es
una red. El coeficiente cíclico local de un vértice i se define como la media de la inversa de los
tamaños de los más pequeños ciclos formado por vértice i y sus vecinos:
2 ∑ 1
Θi = aijaik (8)
ki(ki − 1) Sijk
j,k
donde Sijk es el tamaño de la menor ciclo que pasa a través de los vértices i, j, k. Hay que tener
en cuenta que si los vértices j y k se conectan, el más pequeño ciclo es un triángulo y Sijk = 3.
Si no hay ninguna arista que pasa por i, j y k, entonces estos vértices son tipo árbol Sijk =∞.
El coeficiente cíclico de una red es el promedio del coeficiente cíclico de todos sus vértices:
1 ∑
Θ = Θi (9)
N
i
2.7.3 Grado de distribución
la característica mas importante de un nodo es su conectividad, donde ki indica el numero de
conexiones establecida entre el vértice i y los demás, los vertices conectado con i son común-
mente llamados vecinos del vértice i normalmente se mide a una red con el promedio de conex-
iones de sus nodos ku, y esta dada por:
∑N1
ku = ki (10)
N
i=1
donde N representa el numero de nodos y ku el promedio de conexiones
2.7.3.1 Distribución de probabilidad del grado
La característica de los nodos de una red es un atributo importante es por ese motivo que a veces
es necesario saber cual es el máximo grado de un nodo o el mínimo valor
kmax = max ki (11)
2.8. CONSIDERACIONES FINALES 20
2.7.4 Medidas de centralidad
2.7.4.1 Excentricidad
Este tipo de medida es usada para resolver problemas de localización minimizando la maxima
distancia entre un nodo y cualquier otro nodo, y esta dado por:
eu = max{d(u, v) : v ∈ V } (12)
2.7.4.2 Centroides
Dado un grafo no dirigido G de n vértices. Para una par de vértices u y v, gu(v) denota el
número de vértices que están más cerca de u a v, que se gu(v) = |w ∈ V : d(u,w) < d(v, w)|
2.7.4.3 Cercanía
Puede darse el caso minimizar la sum∑a de las distancias de un vértice u ∈ V a cualquier otro
vértice en un grafo G = (V,E) como v∈V d(u, v)
2.8 Consideraciones Finales
La teoría de redes complejas cada día esta avanzando, generalmente nuevas medidas son adi-
cionadas a las ya existentes y las propiedades que estas tienen ayudan a caracterizar de mejor
manera las las redes complejas dado que esta pueden representar diferentes patrones como se-
ries temporales (señales 1D) e imágenes (señales 2D).
Es importante tener en cuenta que las medidas ayudan a caracterizar a las redes de tal manera
que también podrían servir para medir la semejanza entre redes diferentes, para así establecer
rasgos similares entre redes que representan a patrones semejantes.
CAPÍTULO
3
Reconocimiento de patrones y redes
complejas
3.1 Consideraciones iniciales
En este capitulo se explicaran las técnicas actuales para el reconocimiento de patrones mediante
redes complejas para poder explicar como estos son usados se tomaran dos casos de patrones
los cuales son series temporales e imágenes.
Para el caso de series temporales para redes complejas, se hará una comparación entre las
técnicas existentes para poder encontrar tanto ventajas como desventajas que estas puedan tener
y también se hará lo mismo para las aplicaciones relacionadas a imágenes, en este segundo
caso existen pocos trabajos de aplicación de redes complejas al procesamiento de imágenes
donde el grupo de investigación del instituto de Física de la Universidad de Sao Paulo Brasil
es uno de los principales gestores de aplicaciones en reconocimiento de imágenes mediante el
uso de redes complejas, grupo con el cual se pudo interactuar por eso se detallaran los modelos
creados por este grupo los cuales muestran la manera de como estas redes pueden ser usadas en
la clasificación de imágenes en general.
21
3.2. SERIES TEMPORALES Y REDES COMPLEJAS 22
3.2 Series temporales y redes complejas
Observar la realidad no es mas que la manifestación de eventos que pueden ser complejos e
inciertos en el pasar del tiempo, a pesar que estos eventos no siempre son los mismos, ellos
tampoco son totalmente diferentes. Existe una semejanza y continuidad en ellas mismas que
permite generalizar eventos futuros a partir de eventos pasados. Cuando hablamos de una se-
cuencia de valores observados a lo largo del tiempo, y por tanto ordenados cronológicamente,
la denominamos en un sentido amplio serie temporal. Resulta difícil imaginar una rama de
la ciencia en la que no aparezcan datos que puedan ser considerados como series temporales.
Descubrir conocimiento a partir de series temporales es una de las cosas que el ser humano
intenta realizar para conocer mejor las regularidades de las variables observadas, así como la
comprensión del fenómeno que utiliza dichas variables. Dicho entendimiento de los diferentes
fenómenos pueden ayudarnos a realizar posibles predicciones de dichas series (Box et al., 1976).
Cuando el conocimiento exacto de las leyes que gobiernan un determinado fenómeno es
expresado a través de ecuaciones precisas, mediante la formulación de un modelo matemático
adecuado es posible poder predecir acontecimientos futuros de dicho evento. Anticipar el com-
portamiento futuro siempre despertó el interés en las mas diversas areas del conocimiento hu-
mano. Por ejemplo en finanzas, predecir un ratio es de vital importancia para un inversionista,
o predecir la precipitación es importante para los hidrólogos. Denominamos predicción a la
estimación de valores futuros de la variable en función del comportamiento pasado de la serie
(Salas and Delleur, 1980).
A veces obtener un modelo exacto de los diferentes fenómenos que deseamos predecir es
mas difícil de lo pensado, ya que en casos reales, es casi imposible considerar todas las vari-
ables que afectan dicho fenómeno. Lo cual hace no práctico el intentar modelar el fenómeno
a partir de las variables inmiscuidas. Sin embargo una alternativa diferente para poder realizar
una predicción, consiste en la investigación empírica de la serie temporal de la variable a ser
predecida, en búsqueda de la identificación de regularidades presentes en las observaciones de
la serie de interés. Entonces el desafío se enfoca en encontrar dichas regularidades las cuales
normalmente no son siempre evidentes, al contrario normalmente se encuentran enmascaradas
por el ruido en la serie temporal (Franses and Van Dijk, 2000).
Evidentemente aunque el valor futuro de una serie temporal no sea predecible con total
exactitud, para que tenga interés su estudio, el resultado tampoco puede ser completamente
aleatorio, existiendo alguna regularidad en cuanto a su comportamiento en el tiempo, lo que
hará posible su modelado y por ende hasta su predicción. La búsqueda de regularidades y de
patrones ha sido siempre una de las tareas básicas de la ciencia, y muchas veces se descubren
simetrías que sirven de fundamento para la predicción del comportamiento de los fenómenos,
3.2. SERIES TEMPORALES Y REDES COMPLEJAS 23
incluso antes de que se entienda la razón o causa que justifica esa regularidad. Esto ocurre por
ejemplo con el sistema periódico de los elementos como lo describió (Chatfield, 2003).
Por lo tanto, si podemos encontrar patrones de regularidad en diferentes secciones de una
serie temporal, podremos también describirlas mediante modelos basados en distribuciones de
probabilidad. La secuencia ordenada de variables aleatorias X(t) y su distribución de probabil-
idad asociada, se denomina proceso estocástico. Un proceso estocástico es por tanto el modelo
matemático para una serie temporal (Box et al., 1976) que permitirá estudiarla y analizarla.
3.2.1 Series temporales
Una serie Temporal es un conjunto de observaciones ordenadas en el tiempo, que pueden rep-
resentar la evolución de una variable (económica, física, etc.) a lo largo de él. El objetivo del
análisis de una serie temporal es el conocimiento de su patrón de comportamiento, para así
prever su evolución futura, suponiendo que las condiciones no variarán.
Dado que no se trata de fenómenos deterministas, sino sujetos a una aleatoriedad, el estu-
dio del comportamiento pasado ayuda a inferir la estructura que permita predecir su compor-
tamiento futuro, pero es necesaria una gran cautela en la previsión debido a la inestabilidad del
modelo.
La particular forma de la información disponible de una serie cronológica (se dispone de
datos en periodos regulares de tiempo) hace que las técnicas habituales de inferencia estadística
no sean válidas para estos casos, ya que nos encontramos ante n muestras de tamaño 1 proce-
dentes de otras tantas poblaciones de características y distribuciones desconocidas (Liao et al.,
2005). Por eso formalizar el estudio de dichas series.
3.2.2 Técnicas estadísticas para las series temporales
Se llama Serie de Tiempo a un conjunto de mediciones de cierto fenómeno o experimento
registradas secuencialmente en el tiempo. Estas observaciones serán denotadas por (Keogh
et al., 2004):
{x(t1), x(t2), ..., x(tn) = t ∈ T ⊆ R} (1)
Con x(ti) el valor de la variable x en el instante ti. Si T = Z se dice que la serie de tiempo
es discreta y si T = R se dice que la serie de tiempo es continua. El primer paso en el análisis
de series de tiempo, consiste en graficar la serie. Esto va a permitir detectar las componentes
esenciales de la serie.
El gráfico de la serie permitirá detectar (Keogh et al., 2004):
3.2. SERIES TEMPORALES Y REDES COMPLEJAS 24
• Outlier: Son puntos de la serie que se escapan de lo normal. Un outliers es una ob-
servación de la serie que corresponde a un comportamiento anormal del fenómeno (sin
incidencias futuras) o a un error de medición. Se debe determinar desde fuera si un punto
dado es outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por otro valor
antes de analizar la serie. Por ejemplo, en un estudio de la producción diaria en una
fábrica.
• Tendencia: La tendencia representa el comportamiento predominante de la serie. Esta
puede ser definida vagamente como el cambio de la media a lo largo de un periodo.
• Variación estacional:La variación estacional representa un movimiento periódico de la
serie de tiempo. La duración de la unidad del periodo es generalmente menor que un año.
Puede ser un trimestre, un mes o un día, etc. Matemáticamente, podemos decir que la
serie representa variación estacional si existe un número s tal que: x(t) = x(t+ ks). Las
principales fuerzas que causan una variación estacional son las condiciones del tiempo.
Todos estos fenómenos presentan un comportamiento estacional (anual, semanal, etc.)
• Variaciones irregulares: Los movimientos irregulares (al azar) representan todos los tipos
de movimientos de una serie de tiempo que no sea tendencia, variaciones estacionales y
fluctuaciones cíclicas.
Un modelo clásico para una serie de tiempo, supone que una serie x(1), ..., x(n) puede ser
expresada como suma o producto de tres componentes: tendencia, estacionalidad y un término
de error aleatorio. Existen tres modelos de series de tiempos, que generalmente se aceptan
como buenas aproximaciones a las verdaderas relaciones, entre los componentes de los datos
observados.
1. Aditivo: X(t) = T (t) + E(t) + A(t)
2. Multiplicativo: X(t) = T (t)E(t)A(t)
3. Mixto: X(t) = T (t)E(t) + A(t)
dondeX(t) serie observada en instante t; T (t) componente de tendencia,E(t) es el componente
estacional y A(t) componente aleatoria (accidental). Una suposición usual es que A(t) sea una
componente aleatoria o ruido blanco con media cero y varianza constante. Un modelo aditivo
(1), es adecuado, por ejemplo, cuando E(t) no depende de otras componentes, como T (t), sí
por el contrario la estacionalidad varía con la tendencia, el modelo más adecuado es un modelo
multiplicativo (2). Es claro que el modelo multiplicativo puede ser transformado en aditivo
tomando logaritmos. El problema que se presenta es modelar adecuadamente las componentes
de la serie.
3.2. SERIES TEMPORALES Y REDES COMPLEJAS 25
3.2.3 Análisis de series temporales
Normalmente, la mejor forma de comenzar a analizar los datos de una serie temporal es rep-
resentar las observaciones vs. el tiempo a fin de detectar tendencias, patrones, estacionarios, y
outliers. Si la variabilidad de la serie cambia con el tiempo, es conveniente aplicar una transfor-
mación a los datos que estabilice la varianza. Se suele utilizar una transformación logarítmica
o, en ocasiones, considerar el cambio porcentual de cada observación a la siguiente (en lugar de
las propias observaciones).
En el análisis de las series temporales se considera que las observaciones contienen: a) un
patrón sistemático, y b) un componente de error aleatorio al que llamaremos ruido. La mayoría
de las técnicas tienen como objetivo filtrar dicho ruido.
3.2.4 Análisis de series temporales mediante representación por redes
complejas
Para poder realizar una análisis desde el punto de vista de redes complejas primero es necesario
modelar las series temporales como redes complejas, existen varias propuestas para dicho mod-
elamiento a continuación se mostraran cada uno de ellos para finamente presentar las ventajas
y desventajas que cada modelo tiene.
Diferentes trabajos vienen analizando y comparando varias métodos trabajos como los de
(Zhang, 2007), (Wang, 2011), (Campanharo et al., 2011) esto permite entender la relación que
existen entre las propuestas que serán presentadas
3.2.4.1 Redes de transición
El concepto de la dinámica simbólica permite caracterizar las propiedades de un sistema dinámico
basado en una partición S1, ..., SK de su espacio de fases enK conjuntos disjuntos, produciendo
una transformación de toda trayectoria posible en una secuencia de símbolos abstractos. For-
malmente, la correcta aplicación de los conceptos de análisis simbólico de series de tiempo,
requieren la existencia de una partición que corresponde a una asignación única de secuencias
simbólicas para cada trayectoria del sistema. Se debe tener en cuenta que este requisito es gen-
eralmente violados en aplicaciones del mundo real debido a la presencia de ruido, sin embargo,
ni siquiera en las particiones de casos ideales (sin ruido) se puede estimar. Sin embargo, las
aplicaciones de análisis simbólico de series de tiempo han acaparado el interés considerable en
numerosas aplicaciones (Donner et al., 2008) (Donner et al., 2010).
3.2. SERIES TEMPORALES Y REDES COMPLEJAS 26
El particionamiento del espacio de fases de un sistema dinámico puede ser utilizado para
transformar una serie de tiempo en una representación mediante red compleja. En el caso más
simple es posible identificar los diferentes conjuntos Si como vértices de una red y considerar
las probabilidades de transición para caracterizar las aristas estableciendo una probabilidad de
transición Pmin como un threshold a partir del cual se conectaran las aristas.
Esta manera de crear la red tiene una clara desventaja es que cuando existen variaciones
pequeñas en las amplitudes de la serie temporal al no superar el threshold Pmin se pierde la
información en consecuencia series con pequeñas variaciones serán representadas como redes
similares.
3.2.4.2 Redes de búsqueda de ciclos pseudo periódicos
En 2006, Zhang y pequeños (Zhang et al., 2008) sugirió el estudio de las características topológ-
icas de series de tiempo pseudoperiodicas a través de redes complejas. Esta propuesta considera,
los ciclos individuales como vértices de una red no dirigida, y la conectividad de los pares de
vértices ha sido establecido por el coeficiente de correlación de los ciclos de diferente longitud
o alternativamente, considerar la distancia del espacio de fases.
Un punto de la crítico a este método es que la definición de un ciclo no esta presente nece-
sariamente en sistemas oscilatorios complejos. En (Zhang et al., 2008), los autores consideraron
principalmente los osciladores no lineales en sus regímenes de fase coherente, sin embargo no
es claro cómo podría ser un ciclo definido de oscilaciones fase nocoherente, por ejemplo un
sistema caótico. Además, no es intuitivamente claro la forma de interpretar las correlaciones de
los ciclos, ya que los valores de las medidas correspondientes a la correlación no están exclusi-
vamente determinadas por la proximidad de las partes correspondientes de la trayectoria en el
espacio de fase, sino que dependen también de la elección concreta de muestreo. Esto podría
dar estimaciones bastante diferentes de coeficientes de correlación entre dos ciclos cercanos.
3.2.4.3 Redes correlacionadas
Una generalización del método anterior propuesto por Zhang pero a diferencia del anteriores
que solo se aplica a señales pseudo periódicas este modelo se puede aplicar a series de tiempo
sin evidentes componentes oscilatorios Yang y Yang (Yang and Yang, 2008) en este modelo se
define una dimensión de inmersión simple sobre una serie de tiempo arbitrario, y cada vértice
será representado por la dimensión de inmersión de la serie arbitraria a partir de la cual se puede
calcular el coeficiente de correlación de Pearson a partir del cual dos vértices serán conectados
si superan un threshold. Una dificultad de este método es determinar cuál es la dimensión de
3.2. SERIES TEMPORALES Y REDES COMPLEJAS 27
inmersión mas adecuada para representar la señal en una red compleja dado que no se conoce
mucho de la series puesto que es objeto de estudio (Marwan et al., 2009).
3.2.4.4 Redes según su visibilidad entre estados
Esta propuesta a diferencia de las demás considera como vértice a cada valor de la serie tem-
poral, eso quiere decir que se tendrá tantos vértices como valores tenga la serie temporal y
conectara dos nodos si estos son visibles entre si, eso quiere decir que entre dos estados no haya
un valor mayor al promedio de los dos estados de tal manera que se garantiza la visibilidad entre
estados. Esta propuesta tiene como principal desventaja de caracterizar mas las series aleatorias
y perder algunas de las propiedades de las series temporales caóticas (Lacasa et al., 2008).
3.2.4.5 Redes formadas por el vecino más cercano
Este método define un numero de k para establecer la relación entre dos nodos por lo tanto lo
primero que tiene que realizarse es un agrupamiento donde los vecinos más cercanos a cada es-
tado de la serie temporal, representaran un vértice y dos nodos estarán conectados si ellos están
dentro de la vecindad de un grupo ki, esta aproximación no diferenciara entre redes aleatorias y
caóticas dado que ambas aproximan el espacio de fases y la temporalidad no es considerada en
la conexión de la misma (Xu et al., 2008).
3.2.4.6 Redes Recurrentes
Otro modelo es propuesto por (Xu et al., 2008) el cual particiona el espacio de estados mediante
el uso de un retardo de tiempo dado y dimensión embebida, a continuación, se seleccionan un
número fijo de vecinos más cercanos conectar los nodos. Este modelo resalta las propiedades de
recurrencia de la serie de tiempo original. Similar a las propuestas a otras propuestas donde se
usan representaciones a través de plots de recurrencia. Una variación de esta idea es propuesta
por (Hirata et al., 2008) propone también el uso de plots de recurrencia a partir del cual crea
una matriz de distancias el cual sera considerado como la matriz de adyacencia además añade
pesos siendo este un grafo dirigido.
3.2.4.7 Otros Métodos
Otros métodos para la creación de redes complejas a partir de series temporales son menciona-
dos a continuación
3.3. IMÁGENES Y REDES COMPLEJAS 28
• Otra forma de crear redes complejas fueron propuestas en (Bialonski, 2012) donde anal-
iza diferentes aplicaciones en las cuales se modelan redes complejas, por ejemplo en
el análisis de series temporales que son capturadas de diferentes sensores siendo la red
modelada en función a la correlación que tengan las series temporales capturadas, se pre-
sentan aplicaciones en electro encefelogramas donde cada electrodo es un nodo en la red
y la correlación entre la serie temporal para diferentes intervalos de tiempo son usadas
para crear los enlaces de tal forma que se pueden tener diferentes redes complejas que
pueden ser analizadas.
• Una variación también es propuesta en (Luque et al., 2009) es cual es similar al modelo
basado en visibilidad la diferencia que la linea de vision usada es horizontal siendo esta
un caso particular del cuarto método.
3.2.5 Problemática actual en la representación de las señales
Para el primer método existe una perdida significativa de información, dado que existe un parti-
cionamiento del espacio de estados, el segundo método es bien definido en sistemas oscilatorios
(dado que busca ciclos repetitivos) pero no es muy bien definido para estados no coherentes
como el caos, para el tercer método también busca ciclos de forma arbitraria la desventaja es
determinar la dimensión de los ciclos que se están buscando, el cuarto caso caracteriza mas
las series temporales aleatorias, siendo que las caóticas pierden algunas de sus propiedades y
finalmente este ultimo método no distinguirá los sistemas determinista de los aleatorios
3.3 Imágenes y redes complejas
Una imagen puede ser definida como una función bi-dimensional f(x, y), donde x e y son coor-
denadas espaciales, y la amplitud de f en cualquier par de coordenadas se denomina intensidad
o nivel de gris de la imagen en el punto. Cuando x, y y los valores de la amplitud de f son todos
finitos, cantidades discretas, estaremos ante una imagen digital. El procesamiento de imágenes
digitales concierne al uso de la computadora en el procesamiento de imágenes. Note que una
imagen digital está compuesta de un número finito de elementos, cada uno de ellos teniendo
una particular localización y valor. Esos elementos se llaman elementos pictóricos, elementos
unidad de imagen o píxeles.
Diferentemente a los seres humanos, que están limitados a la banda visual del espectro elec-
tromagnético (EM), las máquinas de imagen cubren prácticamente todo el espectro EM, desde
los rayos gamma hasta las ondas de radio. Pueden trabajar también con imágenes generadas
3.3. IMÁGENES Y REDES COMPLEJAS 29
por fuentes que los humanos no están acostumbrados a asociar con imágenes. Estas fuentes
incluyen las imágenes ultrasónicas, la microscopía electrónica y las imágenes generadas por or-
denador. En definitiva, el procesamiento de imágenes digitales concierne a un amplio y variado
elenco de campos de aplicación. No existe un acuerdo unánime de cuáles son los tópicos que
cubre el Procesamiento de Imágenes Digitales y cuáles son sus interrelaciones con otras áreas
como Visión por Ordenador o Informática Gráfica.
Desde los años sesenta del siglo pasado, el procesamiento de imágenes digitales se ha con-
vertido gradualmente en una de las áreas de investigación científica más importantes. Sin em-
bargo, como cualquier algoritmo de procesamiento de imágenes requiere una vasta capacidad
de procesamiento, su desarrollo limitado ha estado en las manos de unos pocos expertos. Pero
con el desarrollo rápido de los ordenadores, muchas personas han ido apuntando su gran interés
por el procesamiento de imágenes. El desarrollo del procesamiento de imágenes está siendo
acelerado aún más con el rápido avance de las tecnologías relacionadas con la computación en
paralelo, la maximizada capacidad de memoria de los chips, y el sistema de visualización en
color de alta-resolución.
3.3.1 Textura de una imagen
La textura es un ente visual que describe cierto orden estructural o tendencia en los elemen-
tos presentes en una imagen. La figura que se muestra a continuación presenta cuatro tipos de
textura y su histograma representativo. Es una región macroscópica estructurada de la imagen
que presenta propiedades locales constantes, lentamente variables o aproximadamente periódi-
cas. Este orden local radica en la presencia repetida y no casual de partes Elementales que
tienen dimensión similar. Depende de la escala a la que se observa la imagen: la textura de
un píxel no está definida, hay que estudiar la vecindad de un grupo de píxeles. Dependiendo
del tamaño de vecindad elegido la textura puede ser diferente. Características: uniformidad,
densidad, tosquedad, aspereza, regularidad, linealidad, dirección, frecuencia, fase.
Para clasificar la textura se pueden utilizar diferentes técnicas como por ejemplo las redes
neuronales (son preferibles del tipo perceptrón multicapas por el elevado número de entradas
propias de la clasificación de las imágenes), de forma tal que se identifique la tendencia en
las tonalidades de grises presentes en la misma. Ello es, se define un área representativa en la
imagen que mejor describa la textura que se pretende clasificar y se utiliza la información de
los píxeles que la forman (y cierta región de interés) a la que se le asigna determinada clase que
la distinga de otros tipos de textura,
3.3. IMÁGENES Y REDES COMPLEJAS 30
3.3.2 Clasificación de texturas
Para clasificar texturas se pueden usar métodos (Parker, 2010):
• Métodos Estadísticos: La distribución espacial de valores de gris es una calidad que de-
fine la textura. Analizando la distribución espacial de los valores de gris, se computan
características locales de la textura.
• Métodos Geométricos: Consideran la textura compuesta por primitivas. Intentan describir
las primitivas y las reglas que gobiernan la organización espacial.
• Métodos basados en modelos: Se basan en la construcción de un modelo que describe la
textura. Se pueden utilizar para reconocer texturas o para sintetizarlas.
En el caso de representación de texturas mediante redes complejas tenemos algunos modelos
que presentan ventajas y limitaciones que a continuación se explicara.
3.3.3 Representación de texturas mediante redes complejas (Wesley, 2010)
(Backes, 2010)
La descripción de método de representación de la red compleja a partir de una imagen, es a
partir de una malla regular, donde los pixels de la imagen corresponden a los nodos de la malla
y sus aristas serán los 8 vecinos como puede apreciarse en la siguiente figura 3.3.
Figura 3.1: representación de una imagen mediante una malla regular conectada con los 8
vecinos (Wesley, 2010).
Para generar los diferentes modelos será considerado la distancia entre nodos de la malla
regular es decir se debe dar un radio de proximidad permitida para la generación de la red. eso
3.3. IMÁGENES Y REDES COMPLEJAS 31
significa que dos nodos de la red regular estarán conectados si la distancia entre los pixeles no
supera el valor del radio pre establecido.
Como segundo paso se tomara en consideración el valor de intensidad de imagen eso quiere
decir que la semejanza entre un pixel y otro se verá reflejado en el peso de conexión entre
los nodos de la red. Para un caso simple se puede usar simplemente el valor absoluto de la
diferencia entre intensidades de los pixeles vecinos ( en el grado son representados como dos
nodos vecinos ) el cual si no supera el umbral establecido la conexión se mantendría en caso
contrario esa conexión se rompe en ese sentido el grafo deja de ser regular y comienza a vol-
verse red compleja. Este umbral también ira cambiando generando diferentes modelos de redes
complejas
Figura 3.2: Creación de diferentes redes a partir de la malla regular (Wesley, 2010).
3.3.4 Contornos de una imagen
La detección de contorno es parte de un proceso de aislamiento (segmentación), que consiste
en la identificación de objetos dentro de una imagen. Como es usual, hay varias posibles defini-
ciones de un contorno, siendo cada una aplicable en distintas circunstancias. Una de las más
comunes y generales definiciones es el contorno es simplemente un cambio en el nivel de gris
que ocurre en una ubicación especifica. Cuanto mayor es el cambio de nivel, más fácil resulta
detectar el contorno, pero en el caso ideal cualquier cambio de nivel puede ser visto fácilmente.
3.3. IMÁGENES Y REDES COMPLEJAS 32
Una complicación en la detección de un contorno ocurre debido a la digitalización. Es poco
probable que una imagen sea muestreada de manera tal que todos los contornos correspondan
exactamente con un pixel del borde. Por lo general, el cambio de nivel puede extenderse sobre
varios pixeles. Y cuando eso ocurra la posición actual del contorno se considera como el centro
de la rampa que conecta el nivel bajo de gris con el nivel alto. Esta es una rampa sólo en el
mundo matemático, dado que después de que la imagen ha sido digitalizada (muestreada), la
rampa tiene una apariencia escalonada.
La segunda complicación es el clásico problema del ruido. Debido a una gran cantidad de
factores como la intensidad de la luz, el tipo de cámaras y lentes, el movimiento, la temperatura,
efectos atmosféricos, polvo y otros; difícilmente dos pixeles que correspondan precisamente al
mismo nivel de gris en la escena tengan el mismo nivel en la imagen. El ruido es un efecto
aleatorio, y es caracterizado sólo estadísticamente. El resultado del ruido en una imagen es
que produce variaciones aleatorias en el nivel de un pixel a otro, y entonces las líneas suaves y
rampas de los contornos ideales nunca son encontradas en las imágenes reales.
Por eso usar contornos para modelar redes complejas depende en su mayoría de métodos de
segmentación y métodos de detección de contornos.
3.3.5 Métodos para detección de contornos
La forma más simple de detectar un contorno es realizar primero una binarización de la imagen,
esta binarización puede ser realizada mediante un threholding, donde ante un valor umbral los
valores que excedan este umbral tomaran el valor de uno y el resto el valor de cero una vez
realizada este proceso, el siguiente paso es detectar las discontinuidades eso quiere decir buscar
los cambio de valores de 0 a 1 o viceversa de tal manera que se obtiene el contorno de la imagen.
El otro método de buscar discontinuidades es la correlación de la imagen con una máscara.
En este procedimiento se realiza el producto de los elementos de la máscara por el valor de
gris correspondiente a los pixels de la imagen encerrados por la máscara esta mascara puede
ser de diferentes formas normalmente es una máscara de tamaño 3x3 la cual puede representar
diferentes tipos de operadores como por ejemplo Roberts, Prewitt y Sobel.
3.3.6 Creación de red compleja a partir de contornos
Como se puede a preciar en la figura la forma de crear la red compleja es a partir de la distancia
entre los diferentes puntos del contorno es por ese motivo que es necesario primero extraer el
contorno de forma adecuada una vez extraído el contorno se procederá a dar diferentes valores
de radios de tal manera que dos nodos estarán conectados si la distancia entre cualquier par de
3.3. IMÁGENES Y REDES COMPLEJAS 33
nodos es menor que cierto valores predefinidos de tal manera que se tendrán varios modelos
de redes complejas para los diferentes umbrales dados, cada red creada caracterizara alguna
propiedad de la forma de la imagen.
Figura 3.3: Creación de diferentes redes a partir del contorno de una imagen.
3.3.7 Situación actual y problemática en la representación de imágenes
En el caso de las imágenes ya existen algunas propuestas para poder representar una imagen
mediante red compleja pero es importante notar que existen algunas deficiencias que se tiene
que detallar
• Los métodos actuales de construcción de la red son muy simples generan el grafo basados
en distancia dado por un radio predeterminado y analizan las propiedades de la imagen
por separado (forma y textura)
• La forma es considerada mediante los contornos creando redes en función a la detección
de los mismos pero cuando se detecta un contorno se olvidan aspectos como:
– Obviar puntos internos de la imagen (Geometría interna)
– Obvia textura del borde como se comento el borde no es un solo pixel sino general-
mente es una gran catidad de pixeles eso indica que un borde puede tener un especie
de textura del mismo.
• En cuanto al modelo que se basa en la textura se considera la semejanza de intensidades
de niveles de gris entre los pixeles, y esto por el contrario del método anterior:
3.4. CONSIDERACIONES FINALES 34
– Obvia contornos y estructuras internas lo que no es adecuado para una buena repre-
sentación de una imagen
3.4 Consideraciones finales
Como se puede ver existen diferentes maneras de construir redes complejas a partir de series
temporales, cabe resaltar que cada una de ellas tiene ventajas y desventajas en cuanto a su uso
en las diferentes aplicaciones que este pueda tener: Para el primer método existe una perdida
significativa de información, El segundo método es bien definido en sistemas oscilatorios pero
no es muy bien definido para estados no coherentes caos, para el tercer método la desventaja
es determinar la dimensión de los ciclos, el cuarto caso caracteriza mas las series temporales
aleatorias, siendo que las caóticas pierden algunas de sus propiedades, finalmente este ultimo
método no distinguirá los sistemas determinista de los aleatorios
Los métodos actuales de construcción de la red a partir de imágenes, son muy simples
generan el grafo basados en distancia (radio) en función a los contornos se crearan las redes
y por medio de la distancia dada por un radio distancia se enlazaran los puntos de la red este
método, obvia puntos internos (geometría interna), obvia textura interna y textura del borde, y
son dependientes de otros métodos como la detección de contornos. Cuando se usa la textura
se crean redes también basados en un radio de distancia solo que se usara el color como el
responsable de la conectividad, en ese sentido se obvia los contornos y estructuras internas del
objeto a analizar y son dependientes de la calidad de captura de imágenes (intensidades de color
bien definidas).
CAPÍTULO
4
Método propuesto
4.1 Consideraciones iniciales
A continuación se explicaran los modelos propuestos para poder realizar el reconocimiento de
patrones, la idea propuesta es genérica, en el sentido de que puede servir para representar pa-
trones unidimensionales como es el caso de las series temporales y bidimensionales para el caso
de images donde la misma idea es extendida de forma natural, de tal manera que los patrones
pueden ser tratados de la misma forma, no interesando la dimension a pesar que una serie tem-
poral y una imagen son diferentes en dimension, ambas corresponden a patrones comunes de
nuestro mundo.
4.2 Esquema general de la propuesta
Como se puede ver en la figura 4.1 se tiene un objeto de estudio el cual corresponde al patron
que se quiere reconocer, dado que son dos tipos de patrones que se reconocerán, este patron
puede ser una serie temporal o una imagen, según sea uno u otro patron es que se tratan por
separado, cabe aclararse que el uso de las redes complejas se usa únicamente para obtener el
vector de características, donde se ataca principalmente el problema de modelamiento de una
35
4.2. ESQUEMA GENERAL DE LA PROPUESTA 36
red a partir de un patron para luego usar alguna medida de redes complejas para poder realizar
la caracterización de la red en análisis:
Figura 4.1: Esquema general de la propuesta de reconocimiento de patrones mediante redes
complejas.
Si el patron fuese una señal temporal la dinámica de la misma es la característica mas im-
portante a conservar, además se debe tener en cuenta la temporalidad de los estados (existe un
orden dado por el tiempo). Si el caso fuese de una imagen la creación de la red sigue siendo
la misma ya que la diferencia con la serie temporal es que esta señal es de dos dimensiones,
cuando uno trata con este tipo de señal la ubicación de un estado depende de dos variables x, y
y no solo una como pasaba en el caso de una serie temporal, una imagen representa objetos que
quieren ser reconocidos donde normalmente las características que tienen estos objetos están
en función de la forma, siendo esta una característica importante para su reconocimiento. Otro
aspecto importante es la textura que posee el objeto, porque a pesar de tener objetos de formas
semejantes estos pueden tener texturas distintas, en ese sentido es importante tomar en cuenta
esta característica al momento de la representación.
La representación de los patrones mediante una red compleja deben tener en cuenta las car-
acterísticas que anteriormente se mencionaron, por eso las propuestas toman en cuenta esas
características al momento de proponer los modelos respectivos. En la propuesta considera el
preprocesamiento tanto para las series temporales como para las imágenes a diferencia de otras
técnicas propuestas que necesitan de una cantidad considerable de técnicas distintas de proce-
4.3. PROPUESTA PARA CARACTERIZAR SERIES TEMPORALES MEDIANTE RED
COMPLEJA 37
samiento, las que se usan en el sentido de hacer eficiente el manejo de las mismas, ya que una
seria temporal y una imagen normalmente tienen miles de elementos y como los modelos prop-
uestos consideran todos estos elementos es que se hace necesario una reducción de la misma,
pero esa reducción debe preservar las propiedades de cada una de las señales en el caso de las
imágenes es fácil de entender este aspecto ya que uno puede disminuir el tamaño de una ima-
gen disminuyendo la resolución del mismo, claro que existe un limite que para este caso el cual
dependería de la capacidad de memoria que puede soportar el computador pero hoy en día se
pueden procesar varias señales sin problemas, este aspecto solo afectaría a señales que tengan
una dimensionalidad muy grande.
El primer paso para trabajar con la propuesta es hacer representación de la señal como red
compleja para luego caracterizarla red mediante alguna medida de redes complejas que esta red
pueda tener, como se presente en el capituló 2 existen muchas medidas que las redes complejas
pueden tener, en ese sentido se probaron métricas que pueden ser usadas para la caracterización
adecuada del patron a reconocer medidas de grado de conectividad de una nodo obteniendo así
el vector de características.
Finalmente una vez obtenido el vector de características la etapa final implica el uso de
algún clasificador el cual en el caso de la propuesta se usa el support vector machine, pero hay
que tener en cuenta que al usar las redes complejas normalmente el vector de características
tiene una gran dimensionalidad, por eso es necesario hacer uso de técnicas de reducción de la
dimensionalidad como es el caso de esta propuesta que usa el Linear Discriminant Analysis
los detalles de cada una de las estabas se presentaran en las siguientes secciones donde se
describirán detalladamente cada una de las etapas.
4.3 Propuesta para caracterizar series temporales mediante
red compleja
Es importante notar que ya existen métodos que representan las series temporales como se men-
ciono en capítulos anteriores por ese motivo es importante mencionar algunos las diferencias a
las propuestas anteriores tienen al momento de la representación.
• A diferencia del modelo de redes de transición en el modelo propuesto no habrá parti-
cionamiento del espacio de estados, siendo cada valor de la amplitud de la honda el valor
utilizado directamente en el modelamiento del grafo
• En los modelos basados en visibilidad la conexión entre entre un nodo en la posibilidad
de trazar una linea directa entre uno u otro estado si hubiese un estado intermedio que ob-
4.3. PROPUESTA PARA CARACTERIZAR SERIES TEMPORALES MEDIANTE RED
COMPLEJA 38
staculice la linea simplemente no existe conexión en caso contrario existiría conexión en
ese sentido el modelo propuesto usa la distancia entre estados sin considarar la visibilidad
de los mismos.
• En relación a las redes de búsqueda de ciclos pseudo periódicos, la propuesta no busca
ciclos usa directamente las amplitudes y la distancia entre ellas para crear la Red
• En los métodos de redes correlacionadas se calculan coeficiente de correlación, nuestra
propuesta no calcula ningún tipo de correlación solo usa distancia euclidiana entre su
estados.
• En cuanto a las redes formadas por el vecino más cercano podría ser parecido la diferencia
principal es que no se restringe a k posibles estados se usa todos los que se encuentren a
una distancia dada.
4.3.1 Representación de la serie temporal por red compleja
Como se vio en el capitulo anterior una serie temporal es una secuencia de estados a lo largo del
tiempo en la siguiente figura 4.2 se puede apreciar un ejemplo de de serie temporal el cual cor-
responde una señal de voz correspondiente a la palabra uno, naturalmente uno puede apreciar
que es una secuencia de distintos estados donde la variable temporal debería definir la vecindad
que tiene un estado con el siguiente estados de la serie, esto es importante ya que el orden en el
cual están distribuidos esas secuencias son las que hacen que esa señal corresponda a la palabra
uno, si se tuviese otra secuencia de estados (otra serie con otro orden) esta correspondería a otra
palabra como se puede apreciar en la figura 4.3 donde se puede apreciar otra distribución de es-
tados, las cuales corresponden a la palabra dos, entonces podemos tener como punto importante
de una señal la secuencia de valores de la serie y cuando estos valores toman otro orden y otras
amplitudes esta debería corresponder a otro tipo de señal.
El modelo propuesto para construir la red sera el siguiente, sea X el conjunto de valores
correspondientes a la serie temporal el cual es un vector de X[x1, x2, ..., xi, ..., xN ] donde xi
corresponde al valor de cuantización de la serie temporal, otro valor importante en una serie
temporal corresponde a su ubicación temporal, por lo tanto el valor x1 corresponde a la posición
temporal t1, siendo que existe un vector de T donde T [t1, t2, ..., ti, ..., tN ] de tal manera que se
forma un par ordenado (xi, ti), de esta forma cada par ordenado corresponderán a puntos en el
espacio deX×T cada punto corresponderá a la posición de los vertices del grafo de nuestra red
compleja donde el grafo es G(V,A) siendo V los vertices formado por el conjunto de puntos
de la serie t√emporal y A las aristas, las cuales se crearan en función a la distancia euclidiana
d(v 2 2
i, vj) = (si − sj) + (ti − tj) entre un par de vertices, por lo tanto sera necesario definir
4.3. PROPUESTA PARA CARACTERIZAR SERIES TEMPORALES MEDIANTE RED
COMPLEJA 39
Figura 4.2: Ejemplos de serie temporal correspondiente a la palabra uno.
Figura 4.3: Ejemplos de serie temporal correspondiente a la palabra dos.
un valor umbral Θ, el cual esta formado por un conjunto de valores Θ[θ1, θ2, ..., θi, ...θM ] donde
θi corresponde a un valor umbral el cual sera usado para crear una arista entre dos vertices del
grafo G(V,A) donde cada nodo del grafo calculara la distancia euclidiana con todos los demás
nodos de la red, de tal manera que una arista si se cumple que la distancia entre un par de
vertices es menor o igual a un valor θi, dado que Θ es un conjunto deM valores es que existirán
M redes complejas.
En las siguientes figuras 4.4 se pueden ver ejemplos de construcción de redes complejas a
partir de un segmento de la serie temporal de la palabra uno, donde pueden observarse 4 figuras
correspondientes a 4 valores de θ distintos pudiéndose apreciar como el numero de conexiones
entre dos nodos aumenta a medida que el valor de θ aumenta.
4.3. PROPUESTA PARA CARACTERIZAR SERIES TEMPORALES MEDIANTE RED
COMPLEJA 40
Figura 4.4: Ejemplos de redes complejas para diferentes valores de θ en la figura (a) el valore
de θ = 1, (b) el valor de θ = 5, (c) el valor de θ = 10, (d) el valor de θ = 15.
Para poder calcular la distintas redes complejas es necesario calcular una matrizD deN×N
entre los diferentes vertices de la red tal manera que:
 
 d
 1,1 d1,2 ... d1,i ... d1,N 
 d2,1 d2,2 ... d2,i ... d 
2,N 
 . .
.. .. . . . ... ... .. 
D = 
.  (1)
 dj,1 dj,2 ... d 
 j,i ... dj,N
. . . . 
.. .. ... .. ... .. 
dN,1 dN,2 ... dN,i ... dN,N
donde di,j corresponde a la distancia euclidiana entre un par de vertices, dado que el tamaño
de dos series temporales de una misma palabra tienen en general tamaños distintos y los valores
de la cuantización son variados para una misma palabra hablada, es que se deberá hacer una
normalización en el tamaño de dicha serie, de tal manera que deberán ser colocados en un
rango entre valores entre [0, 1] para poder hacer esta normalización se realizara el siguiente
calculo:
4.3. PROPUESTA PARA CARACTERIZAR SERIES TEMPORALES MEDIANTE RED
COMPLEJA 41
D
D = (2)
maxdij
donde maxd corresponde al valor máximo de la matriz D de esa manera las distancias
ij
quedan normalizadas entre los valores [0, 1], dado que los valores ahora están normalizados
el valor del umbral θ tendrá también valores entre [0, 1]. Una vez que se tienen los valores
normalizados es mas fácil obtener las diferentes redes a partir de las cuales se obtendrá el
vector de características.
4.3.2 Obtención del vector de características
El modelo genera varias redes las cuales pueden ser representadas como matrices de adyacencia
y sobre las cuales se calcularan los diferentes vectores de características. Para obtener las
matrices de adyacencia A[A1, A2, ..., Ai, ..., AM ] siendo A el conjunto de matrices y Ai una
matriz de adyacencia para un determinado umbral, la cual se puede obtener con la siguiente
ecuación:
Ai = F (D, θi) (3)
donde Ai corresponde a la matriz resultante, D es la matriz de distancias, θ es el valor del
umbral y la función F y se calcula para cada valor de la matriz de distancias dij como se puede
ver en la siguiente ecuación 4:
{
1 si dij ≤ θi
aij = F (dij, θi) = (4)
0 si dij > θi
El resultado sera una matriz Aij de valores binarios, donde el valor de uno corresponde un
enlace entre el nodo i y el nodo j.
Una vez obtenidas las matrices de adyacencia, el siguiente paso es calcular los valores del
vector de características V [v1, v2, ..., vi, ..., vM ] donde vi se calcula usando el grado de un nodo
gi el cual es: ∑N
gi = aij (5)
j=1
siendo gi el grado del nodo i este es usado para calcular el grado promedio del grafo Ai, de
tal forma que el valor cada componente del vector de características vi es el valor promedio
conexiones de la red Ai como se puede ver en la siguiente ecuación 6:
4.3. PROPUESTA PARA CARACTERIZAR SERIES TEMPORALES MEDIANTE RED
COMPLEJA 42
N
1 ∑
vi = gi (6)
N
i=1
Una cosa que es interesante notar es que los valores de la matriz de adyacencia A1 tienen el
valor de 1 para las distancias menores e iguales que θ1, siendo que θ1 < θ2, entonces la matriz
A1 esta contenida en la matrizA2, este punto es importante ya que calcular una matriz para cada
valor de θi haría que el proceso sea pesado en el calculo de las matrices de adyacencia, además
considerando que las señales de sonido son generalmente de gran dimension lo cual haría que
el proceso de obtención de características sea mas pesado aun.
Por ese motivo para poder alivianar el calculo es que se utilizan algunas variables adicionales
las cuales ayudaran a aprovechar los cálculos de matrices anteriores para los valores promedios
de cada una de las matrices que conforman el vector de características. Dado que los valores de
θi se deben incrementar es que existe una constante δθ que hará que el valor de θ2 = θ1 + δθ,
entonces si el valor de incremento fuese δθ = 0.1 y el valor de θ1 = 0.1 considerando que el
valor de θM = 1 siendo este el máximo posible entonces se tentarían 10 valores distintos.
Entonces el modelo usa este valor para multiplicarlo con todos los valores de la matriz de
distancias normalizadas obteniéndose un nuevo valor D′ = pM × Dq el cual tendrá como
máximo valor de M y los posibles valores que esta matriz tendrá numeros enteros entre [1,M ],
además el tamaño del vector de características es M en ese sentido para poder disminuir el
numero de cálculos la nueva matriz de distancias se recorrerá una sola vez y los valores de
esta matriz dij corresponderán a la posición del vector de características de tal manera que se
irán acumulando, asi el resultado correspondería ana especie de histograma de la matriz de
distan∑cias. Finalmente sobre ese histograma se calculara el valor acumulado siendo el valor de
v′i = M
j=1 vi. Por ejemplo si M = 3 y tuviésemos la siguiente matriz D′:
 
 1 2 3
′ 
D = 3 3 3  (7)
2 2 3
Y el vector de características de valores acumulados quedaría como resultado V = [1, 3, 5],
de esta manera el tiempo de calculo del vector de características disminuye significativamente
y hace factible que el modelo pueda ser aplicado en problemas reales.
Hay que notar que para poder representar una señal en general es importante considerar los
estados o valores que componen la señal ya se 1D o dos 2D cada señal tiene sus peculiaridades
y valores a resaltar y preservar en ese sentido tanto el modelo para series temporales como para
imágenes son parecidos a continuación explicaremos la propuesta para imágenes.
4.4. PROPUESTA PARA LA CARACTERIZACIÓN IMÁGENES MEDIANTE REDES
COMPLEJAS 43
4.4 Propuesta para la caracterización imágenes mediante re-
des complejas
Una imagen captura diversos aspectos que corresponden a una escena, cuando la imagen cap-
turada corresponde a un objeto de interés, es importante caracterizarlo por ese motivo, para
poder representarlo es importante considerar algunos aspectos:
• Considerar la forma: el cual es usado para diferenciar la morfología entre uno u otro
objeto, como es el caso de las figuras geométricas.
• Considerar la textura: La imagen de un objeto normalmente es una una composición de
las distribuciones de intensidad del color además de otros objetos y cuando estos objetos
que los componen y estos son repetitivos, o periódicos, o aleatorios todos estos aspectos
se consideran al evaluar una textura.
• Considerar los niveles de intensidad (color): el color es una percepción visual además los
objetos normalmente tienen un color que lo caracteriza por eso esta característica tiene
que ser considerada.
4.4.1 Representación de la imagen por red compleja
El modelo considerara cada aspecto al momento de representarse como una red, dado que una
imagen puede ser representada como una función f(x, y) donde x y y corresponden a las posi-
ciones de los distintos pixels los cuales están distribuidos como una matriz las cuales tienen
asociados niveles de intensidad en cada posición x, y en consecuencia una imagen puede ser
vista como una superficie en 3D como se puede ver en la siguiente figura 4.5.
En el modelo propuesto, un vértice de la red es el punto P (x, y, I) donde x y y son las
posiciones de los diferentes pixels que los componen e I corresponde al nivel de intensidad,
y se usara la distancia euclidiana entre los vertices para definir las aristas al igual que en la
representación de series temporales, con la diferencia que este tiene un parámetro mas que es la
intensidad, en la siguiente figura 4.6 se puede ver la imagen tomográfica de un cerebro, además
se puede ver la visualización 3D de la misma y finalmente los vertices que corresponden a las
posiciones de cada pixel, se puede notar que esta es una imagen de resolución baja para poder
apreciar las posiciones de los vertices continuos es que se muestra en un espacio mayor como
se puede apreciar claramente en la figura 4.6:
Para poder determinar las aristas se usara el calculo de la distancia entre cada nodo, para el
caso de las imágenes se usara la siguiente ecuación 8:
4.4. PROPUESTA PARA LA CARACTERIZACIÓN IMÁGENES MEDIANTE REDES
COMPLEJAS 44
Figura 4.5: Imagen como una superficie 3D en diferentes ángulos.
√
dij = α((xi − x 2 2 2
j) + (yi − yj) ) + β(Ii − Ij) (8)
donde el valor de α y β corresponden a variables paramétricas que ayudan a dar importancia
a ciertos aspectos, por ejemplo si se tienen valores altos para α y bajos para β eso quiere decir
que vecindades cercanas de pixeles tienen mayor importancia que la semejanza de los niveles
de intensidad y si el fuese el caso contrario los valores de intensidad serían priorizados.
Al igual que el modelo para series temporales se crearan diferentes redes, las cuales se
crearan en función a umbrales distintos Θ[θ1, θ1, ..., θi, ..., θM ] generando varias redes en la
siguiente figura 4.7 se puede apreciar el efecto que tiene el valor de diferentes umbrales, donde
claramente que valores bajos del parámetro de θi representan la importancia del contorno del
objeto dado que el contorno se considera el limite entre dos regiones y corresponden la divi-
sion entre uno y otro nivel de intensidad ese efecto se puede apreciar cuando el valor de este
parámetro toma el valor 2, 4 y 6. Claramente el método propuesto toma en consideración la
forma de los objetos tal como se menciono anteriormente.
4.4. PROPUESTA PARA LA CARACTERIZACIÓN IMÁGENES MEDIANTE REDES
COMPLEJAS 45
Figura 4.6: Representación de los vertices de una imagen del cerebro.
La propuesta también toma en consideración las texturas como se puede ver en la figura
4.8 donde se pueden ver cuatro texturas diferentes y cuatro redes generadas por la propuesta
cuando el valor de θ = 4, en la primera textura se puede apreciar una especie de cuadrícula
tipo una red y al ver su representación en red este aspecto se mantiene lo que es importante
ya que de forma similar sucede con la siguiente textura donde son líneas de distintos niveles
de intensidad y como se ve en su representación en red también mantiene dicha propiedad
otro ejemplo interesante de ver la textura 4 el cual ya es una matiz de intensidades de gris
y en su representación como red esta característica se mantiene. Como se pudo las 4 texturas
representan 4 redes diferentes lo cual es importante para la siguiente etapa donde se determinara
su vector de características.
4.4. PROPUESTA PARA LA CARACTERIZACIÓN IMÁGENES MEDIANTE REDES
COMPLEJAS 46
Figura 4.7: Efecto de diferentes umbrales para establecer las aristas.
4.4.2 Obtención del vector de características
La determinación del vector de características es igual al usado en la serie temporal en ese
sentido se hará un resumen de los diferentes pasos realizados.
• Primero una vez obtenida la matriz de distancias D, es necesario normalizarla de tal
manera que ayude a la determinación de los diferentes umbrales que se necesiten la cual
es realizada por:
D
D = (9)
maxdij
• Determinar el valor de incremento δθ para así determinar el tamaño del vector M .
• Multiplicar la matriz de distancias normalizada por el tamaño del vector de características
D′ = pM ×Dq.
• Calcular el histograma de la nueva matriz de distancias H = hist(D′).
4.5. CLASIFICADOR 47
Figura 4.8: Representación de diferentes texturas, se puede apreciar que las redes son diferentes,
manteniéndose las diferencias entre las cuatro texturas diferentes .
• Finalmente calcular los valores del vector de características V [v1, v2, ..., vi, ..., vM ] a partir
los valores acumulados del histograma H[h1, h2, ..., hi, ..., hM ] según:
∑i
vi = hi (10)
i=1
4.5 Clasificador
El vector de características resultante del proceso anterior tiene normalmente una alta dimen-
sionalidad, por ese motivo se debe usar alguna técnica de reducción de la dimensionalidad
4.5. CLASIFICADOR 48
ya que en general el funcionamiento de un clasificador es pesado computacionalmente en ese
sentido para poder alivianar el proceso es que se debe realizar reducción del espacio de car-
acterísticas el es realizados con el Canonical discriminant analysis (CDA) + Support vector
machine.
4.5.1 Canonical discriminant analysis (CDA)
El CDA es una técnica, que busca maximizar el espacio de separación entre las clases en ese
sentido similar que el análisis de componentes principales y otros métodos como el análisis
de discriminate multiple, etc. Estos métodos buscan el espacio de combinación lineales de las
características originales en el espacio llamado de variables canónicas. para poder realizar este
proceso es necesario tener una idea del espacio entre clases diferentes así como la distan dentro
de una misma clase. Sea U la matriz de dispersion de un vector de características el es definido
de la siguiente manera:
∑N
U = (xi − µ)(x t
i − µ) (11)
i=1
donde µ es el grado promedio de todo el conjunto de muestras. Esta ecuación representa la dis-
persion del conjunto total de los distintos vectores de características pertenecientes a diferentes
clases. Entonces sea Ui la matriz que indique la dispersion de los vectores pertenecientes a una
misma clase.
∑N
Ui = (xi − µi)(xi − µi)t (12)
i∈Ci
dondeCi es el conjunto de muestras de la clase i y µi es el valor promedio de la clase i. Entonces
el valor de variabilidad entre elementos de una misma clases puede ser definida porUintra_clase y
para el caso de la variabilidad entre clases distintas sera Uinter_clase las cuales pueden calcularse
como: ∑K
Uintraclase = Ui (13)
∑ i=1
K
Uinterclase = Ni(µi − µ)(µi − µ)t (14)
i=1
siendo que el valor de K es el numero de clases y Ni el numero de muestras en la clase i. Para
esas medidas de dispersion de los datos serán combinados en una nueva matriz U la cual sera
4.5. CLASIFICADOR 49
la combinación lineal como se puede ver en la siguiente ecuación 15:
U = Uintra_clase + Uinter_clase (15)
Para poder separar estos conjuntos existe una función que podría discriminar las diferentes
clases con la siguiente ecuación 16 la cual esta formada por las variables canónicas:
Yi = ai1X1 + ai2X2 + ...+ aipXp (16)
donde p es el numero de características y aij son los elementos de los autovectores ai = (ai1 +
ai2) + ...+ aip de la matriz C la cual esta dada por:
C = S × S−1inter intra (17)
Esta matriz C sera la encargada de reducir la dimensionalidad de los vectores de entrada y de
esa manera hacer que el proceso siguiente sea menos pesado, en el caso de la propuesta se uso
las maquinas de vectores soporte que es una técnica de clasificación supervisada.
4.5.2 Maquinas de vectores soporte (MVS)
Las maquinas vectores soporte son clasificadores capaces de encontrar una funciones de dis-
criminación que pueden ser lineales o n lineales que se usan para separar el espacio de repre-
sentación en regiones correspondientes a cada una de las clases consideradas (Vapnik, 2000).
MVS mapea los puntos de entrada a un espacio de características de una dimensión y en-
cuentra un hiperplano que los separe y maximice el margen m entre las clases en este espacio
como se aprecia en la 4.9. Maximizar el margen de separación m implica un problema de op-
timización de programación cuadrática que puede ser resuelto usando los multiplicadores de
Lagrange. De tal manera que se encuentra el hiperplano óptimo de separación utilizando el
producto punto con funciones en el espacio de características que son llamadas kernels. Este
hiperplano es la combinación de unos pocos puntos correspondiente a los patrones de entrada
que son llamados vectores de soporte. Existen dos casos que esta técnica puede resolver: prob-
lemas linealmente separables y no linealmente separables.
4.5.2.1 Caso linealmente separable
Supongamos que nos han dado un conjunto S de puntos etiquetados para entrenamiento como
se aprecia en al Figura 4.9
4.5. CLASIFICADOR 50
Figura 4.9: Caso linealmente separable
Cada punto de entrenamiento x ∈ Rn
i pertenece a alguna de dos clases y se le ha dado una
etiqueta yi ∈ 1,−1 para i = 1, ..., l En la mayoría de los casos, la búsqueda de un hiperplano
adecuado en un espacio de entrada es demasiado restrictivo para ser de uso práctico. Una
solución a esta situación es mapear el espacio de entrada en un espacio de características de una
dimensión mayor y buscar el hiperplano óptimo. Deseamos encontrar el hiperplano
W.z + b = 0 (18)
definido por el par (w, b), tal que podamos separar el punto xi, de acuerdo a la función
{
1 si yi = 1
f(xi) = signo(W.zi + b) = (19)
−1 si yi = −1
donde w ∈ Z y b ∈ R, el conjunto S se dice que es linealmente separable si existe (w, b) tal
que las siguientes inecuaciones:
{
W.zi + b ≥ 1
(20)
W.zu + b ≤ −1 i = 1, ..., l
Sean válidas para todos los elementos del conjunto S. Para el caso linealmente separable
de S, podemos encontrar un único hiperplano óptimo, para el cual, el margen entre las proyec-
ciones de los puntos de entrenamiento de dos diferentes clases es maximizado.
4.5. CLASIFICADOR 51
4.5.2.2 Caso no linealmente separable
Si el conjunto S no es linealmente separable entonces ocurrirán errores en la clasificación de
la SVM, como puede ser visto en la siguiente figura 4.10 no se puede establecer una linea
de separación para resolver el problema dado que los datos tienen una distribución circular
estando una clases dentro de otra clase Para tratar con datos que no son linealmente separables,
Figura 4.10: Caso no linealmente separable
el análisis previo puede ser generalizado introduciendo algunas variables no-negativas ξi ≥ 0
de tal modo que la ecuación 20 es modificado a
yi(w.zi + b) ≥ 1− ξi, i = 1, ..., l (21)
Los ξi 6= 0∑en (3)son aquellos para los cuales el punto xi no satisface la ecuación 19. Entonces
el término l
(i=1)ξi puede ser tomado como algún tipo de medida del error en la clasificación.
El problema del hyperplano óptimo e{s entonces re∑defin}ido como la solución al problema
min 1w.w + C ξ
2 i
yi(w.zi + b) ≥ 1− ξi, i = 1, ..., l (22)
ξi ≥ 0, i = 1, ..., l
donde C es una constante. El parámetro C puede ser definido como un parámetro de regular-
ización. Este es el único parámetro libre de ser ajustado en la formulación de la SVM. El ajuste
de éste parámetro puede hacer un balance entre la maximización del margen de separación entre
clases lo cual afecta a la clasificación.
4.6. VALIDACIÓN CRUZADA 52
Encontrar el hiperplano óptimo en la ecuación 22 es un problema de programación cuadrática,
que puede ser resuelto construyendo un Lagrangiano y transformándolo en el dual:
∑ ∑∑
max W∑(α) = α 1
i − αiα2 jyiyjzizj (23)
donde yiαi = 0, 0 ≤ αi ≤ C, i = 1, ..., l
donde , w ∈ Z y b ∈ R, α = (α1, ...αl) es una vector de multiplicadores de Lagrange positivos
asociados con las constantes en la ecuación 21.
Finalmente la idea es encontrar los valores de lo pesos w de tal manera que sea el hiperplano
óptimo de separación según la siguiente formu∑la
W = αiyizi (24)
Utilizando la función signo(w.z + b) se podrá determinar la respuesta correcta a nuestro prob-
lema
El usos de MVS puede usar varios kernels para poder clasificar los datos, la forma genérica
es K(xi, xj) ≡ φ(x )Ti φ(xj), es necesario probar con diferentes kernels:
• Linear: K(xi, x
T
j) = xi xj
• Polynomial: K(xi, xj) = (γxT d
i xj + r) , γ > 0
• Radial basis function(RBF):
K(xi, xj) = exp(−γ ‖ xi − x 2
j ‖ ), γ > 0
• Sigmoid: K(xi, x
T
j) = tanh(γxi xj + r)
4.6 Validación cruzada
Para poder validar los modelos de reconocimiento se planteo realizar la validación cruzada esta
es una técnica que se aplica al conjunto de datos inicial y se usa para evaluar de forma más
o menos exacta la calidad de un modelo de clasificación. La mayor ventaja de este diseño
experimental es que las estimaciones del error sobre los conjuntos de test son independientes
(los conjuntos de test no se solapan). Sin embargo, sí existe un cierto solapamiento en lo
que se refiere al conjunto de entrenamiento, ya que cada pareja de conjuntos de entrenamiento
comparte una alta fracción de los ejemplos pero a pesar de esto es una de las técnicas mas usada
para validar un modelo.
4.7. CONSIDERACIONES FINALES 53
En este método, los datos disponibles que tienen dimension n se dividen aleatoriamente en k
conjuntos de ejemplos disjuntos de igual tamaño, T1, .., T⋃k. Se realizan k experimentos, usando
como conjunto de entrenamiento en la iteración i-ésima j=6 i Tj y como conjunto de test Ti.
En esta tesis se uso un tipo particular de validación que es leave-one-out. Este tipo de
validación es un caso particular de la validación cruzada en el que k coincide con el número
total de patrones de aprendizaje n del conjunto de total de patrones. Estaríamos ante el caso más
extremo, ya que cada modelo estaría entrenado con n− 1 casos y probado con el caso restante
no usado. Este es el método de validación que devuelve resultados más exactos, pero su gran
inconveniente es la necesidad de entrenar tantos modelos como casos tuviera el conjunto de
datos inicial y el coste computacional necesario para llevar a cabo el proceso puede llegar a ser
muy elevado. Pero el nivel de confianza en este tipo de pruebas es mayor que otros métodos.
4.7 Consideraciones finales
Los modelos propuestos intentan mantener las características propias de cada tipo de señal
eso es importante para las operaciones de reconocimiento. En el caso de la serie temporal la
secuencia de estados según la temporalidad se mantiene y su análisis es realizado a nivel de
estructura topológica lo que es importante ya que la dinámica de un sistema es analizado desde
otro enfoque. En el caso de las imágenes las características de contornos, texturas e intensidades
de gris se mantienen en la representación mediante red compleja lo que también es deseado en
cualquier técnica de reconocimiento de patrones.
CAPÍTULO
5
Resultados experimentales
El modelo propuesto fue probado en dos aplicaciones distintas, una para el caso de series tem-
porales donde el modelo fue usado para el reconocimiento de palabras habladas. En este caso
se demostró como el modelo puede servir para extraer características de una señal de voz, las
palabras habladas corresponden a la grabación de los numeros del cero al nueve. Por otro lado
el modelo también fue probado para el reconocimiento de imágenes, en un proyecto que se
desarrolla en el marco de la cátedra Concytec, el proyecto consiste en el reconocimiento de
parásitos helmintos, en esta aplicación se demostró la aplicabilidad del modelo propuesto los
resultados serán presentados en las siguientes secciones.
5.1 Resultados de la aplicación para el reconocimiento de
palabras
Para el reconocimiento de palabras el modelo es usado para demostrar la aplicabilidad en el
reconocimiento de señales de voz. El modelo propuesto usa el criterio del par ordenado (A, t)
donde A es el valor de amplitud de la señal y t es el tiempo de duración de la grabación.
54
5.1. RESULTADOS DE LA APLICACIÓN PARA EL RECONOCIMIENTO DE
PALABRAS 55
Figura 5.1: Gráfica de las amplitudes de las palabras grabadas: En la figura(a) son nueve pal-
abras diferentes; el numero Uno, Dos, Tres, Cuatro, Cinco, Seis, Siete, Ocho y Nueve; En la
figura (b) Muestras de una misma palabra pueden ser vistas
5.1. RESULTADOS DE LA APLICACIÓN PARA EL RECONOCIMIENTO DE
PALABRAS 56
5.1.1 Adquisición, Cuantificación y Muestreo
El primer paso a desarrollar es la adquisición, cuantificación y muestreo de la señal. Para dicho
propósito se elaboro una base de datos de palabras habladas de los dígitos del uno al nueve
de los cuales se tuvo veinte ejemplares de cada palabra obteniéndose un total de 180 palabras,
para la grabación se utilizó un micrófono multimedia y la tarjeta de sonido de un computador
personal, la frecuencia de muestreo de la grabación fue de 44100 hz y la cuantificación fue
realizada a 16 bits.
En la siguiente figura 5.1 se puede apreciar algunas de las palabras grabadas, como se puede
apreciar la forma de las amplitudes de la señal son diferentes para palabras diferentes, esa
motivación ayuda a que la representación mediante redes complejas ayudara a acentuar esas
diferencias cuando sean representadas como redes complejas.
Figura 5.2: Determinación de ventanas solapadas para la detección del inicio y fin de palabra
5.1. RESULTADOS DE LA APLICACIÓN PARA EL RECONOCIMIENTO DE
PALABRAS 57
5.1.2 Detección de inicio y fin
Una vez realizada la adquisición, es necesario implementar un algoritmo detector de inicio y fin
de la señal con el objetivo de eliminar información redundante de la señal (eliminar el fondo,
segmentando el inicio y el final de la señal de voz propiamente dicho).
Figura 5.3: Determinación de ventanas solapadas para la detección del inicio y fin de palabra
Este proceso de segmentación se realiza a través del cálculo de energía y detección de um-
brales de actividad de señal, el algoritmo basa sus cálculos en promedios temporales (mediante
el análisis una ventana de tiempo rectangular) del valor absoluto de la señal, el valor calculado
de la energía de la señal en esa ventana esta dado por la siguiente ecuación:
∑N1
E = |x(i)|2 (1)
N
i=1
donde el valor de E (energía) es comparado con un umbral T , si el valor es mayor que ese
umbral se dice que corresponde a la señal de voz y si es menor entonces se dice que es ruido
5.1. RESULTADOS DE LA APLICACIÓN PARA EL RECONOCIMIENTO DE
PALABRAS 58
(fondo de la señal), la venta es solapada como se puede ver en la figura 5.3. Para determinar el
valor de umbral se calculo la energía de un segmento de ruido en ese sentido es necesario grabar
una porción de ruidos para una ventana dada, en este caso el tamaño de la venta es de 400 y el
valor del umbral en promedio es T = 0.8 el cual garantiza diferencia la señal de voz y el ruido
de la misma. Una vez determinado el inicio y fin de una palabra el siguiente paso es extraer
las características mediante redes complejas y finalmente se realiza la clasificación usando un
clasificador.
5.1.3 Extracción de características
Para poder extraer las características se uso el modelo propuesto para reconocimiento de series
temporales, el cual fue explicado en la sección 4.3, en el cual se construyeron varias redes
en función a la distancia entre cada par ordenado (A, t) que compone la serie temporal, en la
detección del inicio y fin de una palabra el tamaño de las palabras tiene dimensiones distintas
pero todas ellas son normalizadas a un intervalo entre [0 : 1] eso ayuda a la extracción de
características independientemente de la cantidad de elementos que tenga el vector de la señal.
El efecto de crear la red para diferentes distancias se puede ver en la figura 5.4 en el cual
se puede ver un segmento de la serie temporal, el cual corresponde 300 muestras de la serie
temporal y se varia el umbral de conectividad,el que indica la distancia maxima entre cada par
de nodos de la red. Como se puede ver a medida que el valor del umbral aumenta el número de
conexiones también se incrementa.
El vector de características es obtenido mediante la creación de diferentes redes, donde el
parámetro de umbral U varia desde U1 = 0.01 hasta el valor de U386 = 0.9 con incrementos de
δT < 0.0025 dando un total de 356 características, según las pruebas realizadas este parámetro
presente los mejores resultados.
5.1.4 Clasificación de las palabras habladas
Para la clasificación de las palabras habladas, el modelo debe ser capaz de discriminar entre los
diferentes sonidos de entrada realizando el reconocimiento de cada una de éstas con respecto a
un conjunto de datos previamente aprendido. Primero los datos obtenidos en la extracción de
características fueron reducidos de su dimensionalidad usando Canonical discriminant analysis
donde la dimension de 356 es reducida a 9 variables canónicas dado que existen 9 clases de pal-
abras en la siguiente figura 5.5 se puede apreciar gráficamente la relación entre algunas de estas
variables canonicas, donde se puede se puede ver que en algunos sub espacios pertenecientes
5.1. RESULTADOS DE LA APLICACIÓN PARA EL RECONOCIMIENTO DE
PALABRAS 59
Figura 5.4: Redes construidas para diferentes distancias
a una misma palabra las cuales son de un mismo color, los elementos están separados casi
totalmente de otro sub conjunto, eso hace notar que habrá una clasificación adecuada.
Para las pruebas del modelo propuesto fue realizado la validación cruzada del tipo leave-one-out
usando como método de clasificación la maquina de soporte vectorial. Para poder probar la
maquina de soporte vectorial es necesario probar con diferentes parámetros siendo uno de los
principales el kernel que se debe usar, según el tipo de kernel se deben definir ciertos parámetros
como por ejemplo en el caso de un polinomial se debe ingresar como parámetro el grado del
mismo que podría ser cuadrático, cubico, etc. Otro parámetro usado también es el de regular-
ización el cual define si existe o no vectores dentro del margen de separación. En ese sentido el
modelo final de clasificación es robusto porque fue probado con diferentes variaciones de ker-
nel en la clasificación, kernels como el de base radial entre otros a pesar de obtener resultados
no adecuados, cometiendo mucho error por eso no fueron considerados en las estadísticas, eso
hace notar que los grupos formados no tienen distribución de datos de funciones de base radial.
Por otro lado en lo correspondiente a la creación de la red se probo con la variación del
parámetro de conectividad delta δT al momento de extraer características, hay tomar en cuenta
que a menor valor de δT mayor cantidad de características. Como podemos ver en la siguiente
5.1. RESULTADOS DE LA APLICACIÓN PARA EL RECONOCIMIENTO DE
PALABRAS 60
Figura 5.5: Relación entre las diferentes variables canónicas
tabla 5.6 donde el parámetro de conectividad fue incrementandose gradualmente, de tal manera
de poder encontrar los parámetros correctos para la clasificación de nuestro problema.
Finalmente podemos ver los resultados en la tabla 5.6, como se pudo ver cuando el valor de
∆T = 0.006 el porcentaje de acierto es el 99.99% tanto para el kernel polinomial como para el
lineal, pero si observamos la matriz de confusión el error se da en palabras diferentes, por eso a
continuación mostraremos las 2 matrices de confusion para los dos casos:
El caso del kernel lienal lo podemos ver en la tabla 5.2 donde el error de clasificación se da
en la palabra cuatro, el cual es confundido con la palabra ocho eso significa que de los veinte
ejemplares correspondientes a la palabra cuatro uno de ellos fue clasificado incorrectamente
como clase 8, por otro lado los del tipo ocho si fueron correctamente clasificados pero en la
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 61
Clasificador Nro. de carac- Nro. de imá- Porcentaje % ∆T
terísticas genes correctas Acierto
SVM - Lineal 890 166 92.22 0.001
SVM - Polinomial 890 163 90.55 0.001
SVM - Lineal 445 161 89.00 0.002
SVM - Polinomial 445 163 90.55 0.002
SVM - Lineal 222 171 95.00 0.004
SVM - Polinomial 222 171 95.00 0.004
SVM - Lineal 148 179 99.44 0.006
SVM - Polinomial 148 179 99.44 0.006
SVM - Lineal 110 164 91.11 0.008
SVM - Polinomial 110 166 92.22 0.008
SVM - Lineal 89 159 83.33 0.01
SVM - Polinomial 89 149 82.77 0.01
Tabla 5.1: Comparación de los resultados para diferentes parámetros del modelo propuesto.
recuperación de sus valores uno a mas fue realizado. Sin embargo en el caso del kernel poli-
nomial los resultados de error son diferentes al caso anterior, en este caso el error se da en la
recuperación de la palabra ocho, como se puede ver en la tabla 5.3, donde hay una palabra ocho
que no fue recuperada correctamente y podemos ver que el caso de la palabra cuatro uno a mas
fue reconocido siendo este el contrario del caso anterior, eso quiere decir que la separación entra
la palabra ocho y cuatro tienen una dificultad al momento de separar dichas clases.
5.2 Reconocimiento de parásitos helmintos
Para poder demostrar la aplicabilidad del modelo propuesto en la clasificación de imágenes se
utilizo los datos del proyecto PIBAP titulado Sistema automático de diagnostico de parásitos
intestinales a través de imágenes digitales (Contrato 028-2009-FINCyT-UNSA) en ese sentido
algunos de los resultados de esta investigación son usados para poder compáralos con los re-
sultados obtenidos con el modelo propuesto. Dado que esta tesis formaba parte del proyecto
anteriormente mencionado es que parte de la información de este capitulo fue resultado de in-
formes técnicos, así como artículos publicados en el marco del proyecto del cual se participo
como tesista.
Es importante tener en cuenta que un Helminto es un parásito que produce enfermedades
infecciosas. Las infecciones parasitarias provocadas por Helmintos están vinculadas a condi-
ciones socio ambientales que aquejan a Peruanos de bajos recursos económicos que viven en
condiciones favorables para el desarrollo de estos parásitos: cambios climáticos, alimentación
insuficiente, vivienda precaria, tierra contaminada, ausencia de agua potable, etc (Flint et al.,
2005).
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 62
1 2 3 4 5 6 7 8 9 Co(%)
1 100.0 0
2 100.0 0
3 100.0 0
4 95.0 5.0 5.0
5 100.0 0
6 100.0 0
7 100.0 0
8 100.0 0
9 100.0 0
Om(%) 0 0 0 0 0 0 0 5.0 99.44
Tabla 5.2: Matriz de confusion, cons sus respectivos error por cada clase, usando SVM con
kernel lineal.
1 2 3 4 5 6 7 8 9 Co(%)
1 100.0 0
2 100.0 0
3 100.0 0
4 100.0 0
5 100.0 0
6 100.0 0
7 100.0 0
8 5.0 95.0 5.0
9 100.0 0
Om(%) 0 0 0 5.0 0 0 0 0 99.44
Tabla 5.3: Matriz de confusion, cons sus respectivos error por cada clase, usando SVM con
kernel polinomial.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 63
Usualmente en puestos de salud publica de comunidades de bajos recursos del Perú no se
dispone de personal capacitado para diagnosticar enfermedades provocadas por estos parási-
tos. Habitualmente para realizar el diagnóstico en este caso se recurre a recolectar muestras de
heces de los pacientes y enviarlas a la ciudad más cercana para que realicen el diagnóstico. La
propuesta de realizar un sistema automático de diagnóstico tiene por objetivo principal realizar
un diagnóstico en tiempo real tomando las muestras de las imágenes de las micrografías desde
un microscopio y reducir el tiempo de espera para poder realizar un diagnóstico rápido. Au-
tomatizar este proceso que normalmente es realizado por personal altamente capacitado como
Biólogos expertos en parasitología, se dificulta al depender de procesos variables no automatiz-
ables como el procedimiento sedimentación y centrifugación de la muestra, incluso posterior a
este procedimiento es necesario aplicar una solución química sobre la micrografía para resaltar
los parásitos ante el ojo humano.
Actualmente los biólogos para distinguir a un parásito de un artefacto no deseado se basan en
la morfología de los Helmintos que normalmente son circulares y ovoides, el siguiente paso para
realizar el descarte es distinguir si la textura es rugosa o lisa; no consideran al color como una
característica relevante por ser directamente dependiente de las soluciones químicas que aplican
a la micrografía para que los candidatos puedan ser resaltados de mejor manera para el ojo
humano. Cabe resaltar que los biólogos caracterizan a estos parásitos para poder identificarlos
correctamente. Por eso con el modelo propuesto que integra la característica de la forma de los
objetos así como la textura de la misma, es algo que podría beneficiar a la automatización del
diagnostico de los parásitos por considerar aspectos que los biólogos resaltan en su diagnostico.
5.2.1 Conjunto de datos
Los experimentos fueron realizados sobre la base de datos SADPI8 v2.0 proporcionada por
el grupo PibapUnsa1 que contiene imágenes microscópicas extraídas de dos laboratorios de
diferentes ciudades del Perú, algunas imágenes de dicha base son mostrados en la figura 5.6.
Las imágenes fueron obtenidas con un microscopio óptico (MOTIBAC) el cual esta acoplado a
un ordenador por el cual se capturan imágenes con una magnificación objetiva 40× en formato
JPG. Los nombres de los parásitos que fueron usados para probar el modelo están están listados
en el cuadro 5.4 y pueden ser vistos en la figura 5.7. El conjunto de imágenes de micrografías
por especie así como imágenes segmentadas de entrenamiento están puestos en el siguiente
cuadro 5.4. Como se puede apreciar hay un total de 1036 imágenes como se puede apreciar no
existe la misma cantidad de imágenes por cada tipo de parásito, eso debido a que la incidencia
de un tipo de parásito es mayor que los otros.
1The website of this project is www.pibapunsa.org
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 64
Figura 5.6: Imágenes de la base de datos SADPI8 v2.0
Es importante notar que las imágenes originales capturadas desde el microscopio son como
las mostradas en la figura 5.6 donde podemos ver que existe la presencia de parásitos y además
de otros objetos a los cuales se llamaran artefactos por eso es necesario realizar la segmentación
de los objetos de interés (parásito), pero ese proceso no fue implementado en esta tesis ya que el
trabajo fue realizado por (Chuctaya et al., 2010) proporcionando los parásitos ya segmentados
estas imágenes fueron las que se usaron para probar el modelo.
Es importante notar que cada tipo de parásito es diferente y tienen características propias, en
la siguiente figura 5.7 se pueden apreciar las imágenes de cada uno de los helmintos a reconocer
como se puede ver tienen diferentes características que fueron formalizadas por descripciones
de los especialistas de la facultad de medicina de la Universidad Nacional de San Agustín.
Dicha formalización realizada por los expertos serán comentadas a continuación:
1. Trichiuris trichuira: Los huevos de esta especie tienen una forma o aspecto de limón,
con dos prominencias polares translucidas, semejantes a tapones. El tamaño varía de 50
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 65
Especie Num de Num de muestras
micrografías segmentadas
Ascaris Lumbroides 100 81
Uncinarias 75 51
Trichuris Trichiura 102 106
Hymenolepis Nana 115 74
Dyphillobothrium 103 164
Taenia Solium 211 231
Fasciola Hepatica 280 259
Enterobius Vermicularis 91 70
Total 866 1036
Tabla 5.4: Cantidad de micrografías por especie y parásitos segmentados encontrados en las
micrografías
Figura 5.7: Nombres de parásitos: 1) Ascaris 2) Uncinarias 3) Trichuris trichuria 4) Hy-
menolepis nana 5) Dyphillobothrium pacificum 6) Taenia solium 7) Fasciola hepática 8) En-
terobius vermicularis
a 54 por 23 micras. Presenta una capa externa de color amarillento y una capa interna
transparente. Los huevos fertilizados al momento de la oviposición = al ser expulsados
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 66
al exterior no muestran segmentación. El desarrollo embrionario tiene lugar fuera del
huésped.
2. Uncinarias por las especies Necator americanus y Ancylostoma duodenale: Los huevos
de estas dos especies, son casi indistinguibles, difieren solo ligeramente en el tamaño N.
americanus es de 64 a 76 por 36 a 40 micras mientras que los de A. duodenale son de
56 a 60 por 36 a 40 micras (hecho que el ojo humano no diferencia de manera rutinaria).
Los huevos tienen extremidades romas, redondeadas, y una capa hialina transparente, del-
gada, no están segmentados en la oviposición. En las heces frescas se les encuentra con
dos a ocho etapas celulares de división.
3. Ascaris lumbricoides: Los huevos miden de 45 a 70 por 35 a 50 micras. Una cubierta
externa densamente mamelonada, albuminosa que sirve de barrera auxiliar contra la per-
meabilidad, a veces puede faltar. El huevo propiamente dicho tiene una capa gruesa,
transparente, hialina con cubierta externa relativamente gruesa, que actúa como estructura
de sostén y otra interna, vitelina, delicada, lipoidal y muy impermeable. En el momento
de la oviposición, la cubierta contiene una masa ovoide de protoplasma no segmentado,
densamente impregnada con gránulos de lecitina. Los huevos no fértiles son mas largos
y estrechos, miden de 88ł 94 por 39 a 44 micras, tiene una cubierta más delgada y otra
irregular albuminosa, estando completamente llenos de una masa amorfa de protoplasma,
son gránulos retráctiles. También, hay huevos de aspectos caprichosos, sin cubierta al-
buminosa, con cubiertas externa anormales irregularmente. Generalmente los huevos no
fértiles, son difíciles de identificar y pueden pasar inadvertidos ante los ojos de un obser-
vador poco acucioso=poco entrenado.
4. Enterobius vermicularis: Los huevos de esta especie son difíciles de encontrar en un
examen de heces rutinario. Se les puede identificar muy rápidamente por su aspecto
asimétrico y por su contenido, un embrión bien desarrollado.
5. Diphyllobothrium pacificum: Los huevos miden de 55 a76 por 41 a 56 micras, tiene
una capsula simple con un opérculo medio oculto en uno de sus extremos y muestra un
pequeño engrosamiento en forma de botón en el otro.
6. Hymenolepis nana: El huevo es de forma oval o globular, miden de 47 por 37 micras.
Presentan dos membranas que encierran un embrión hexacanto. La membrana interna
tiene dos engrosamientos polares, de cada uno de ellos nacen de cuatro a ocho filamentos
polares muy finos.
7. Taena saginata / Taenia solium:Los huevos de estas especies no pueden distinguirse con
facilidad, son prácticamente iguales. Son de un color amarillo pardusco, con una cubierta
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 67
estriada radialmente que encierran un embrióforo. Miden de 30 a 40 por 20 a 30 micras.
Algunas veces se pueden observar huevos rodeados por una capa o membrana externa con
dos delicados filamentos polares(como se encuentran en el útero del céstodo), pero que se
pierden inmediatamente dejan el proglótido del céstode. Alguno autores, señalan que los
huevos maduros de Taenia solium, son indistinguible de los de Taenia saginata, contiene
un embrión hexacanto rodeado por una cubierta esférica o semiesférica, estriada, gruesa,
de color café claro y con un tamaño de 30 por 40 micras de diámetro.
8. Fasciola hepatica:Los huevos de esta especie, son grandes y ovales, de color amarillo
- pardusco. Son operculados y miden de 130 a 150 por 65 a 90 micras; no presentan
segmentación al momento de la oviposición(cuando son expulsados al exterior).
Una muestra de la base de datos de imágenes usada se puede ver en la siguiente imagen 5.8:
Estas características formalizadas ayudaron a determinar las técnicas de procesamiento de
imágenes necesarias para que estas pueden ser cuantificadas en un vector de características, por
eso es necesario dar conceptos teóricos de dichas técnicas ya que estas fueron implementadas y
probadas para poder comparar el modelo propuesto frente a técnicas ampliamente usadas en el
reconocimiento automático de imágenes.
5.2.2 Técnicas de extracción de características
La propuesta esta fundamentada en la simulación de los criterios de los biólogos donde la mor-
fología de los parásitos fue uno de los criterios tomados en consideración, otro aspecto impor-
tante es la textura. En el articulo (Humpire et al., 2011), mostraron resultados de clasificación
en los cuales el vector de características es de tamaño 8 y esta compuesto por dos descriptores:
4 geométricas y 4 de textura Gray Level Co-Ocurrence Matrix(GLCM) que usan el contorno y
la imagen en escala de grises del candidato. A continuación describiremos la técnica usada en
el articulo para poder comparar los resultados con los obtenidos por esta propuesta.
5.2.2.1 Características geométricas
Para poder definir la morfología del candidato es importante detectar el contorno exterior del
parásito para poder detectar el contorno se uso el filtro de Canny (Canny, 1986). La detección
del borde es un enfoque común para detectar discontinuidades diferenciales en imágenes en
niveles de gris. Para lograr dicho objetivo se usa la primera y segunda derivada como gradientes
y el laplaciano para detectar bordes en una imagen.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 68
Figura 5.8: Muestra de imágenes de diferentes parasitos de la base de datos usada para la
clasificación de parásitos
Un borde es un conjunto de puntos con el mismo nivel de intensidad entre los pixeles de
la imagen. Los bordes en una imagen pueden generalmente ser divididos en dos categorías de
bordes de intensidad (abruptos cambios) y borde de textura (regiones invariantes a condiciones
de luminosidad) (Tan et al., 1989). Este método es ideal para especies que tienen un cubierta
semitransparente en vista que la binarización puede obviar varias partes que imposibiliten su
proceso normal.
Para poder realizar la detección de contornos mendicante el algoritmo de Canny los sigu-
ientes pasos tienen que ser realizados:
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 69
5.2.2.2 Obtención del gradiente
Para la obtención del gradiente el método utiliza el filtro gaussiano aplicado a la imagen original,
con el propósito de suavizar la imagen y trata de eliminar posible ruido existente, pero hay
que tener en cuenta que no se debe realizar un suavizado excesivo ya que implicaría perdida
de características de la imagen, y generaría resultados no óptimos. Una vez que se suaviza la
imagen, para cada píxel se obtiene la magnitud y módulo (orientación) del gradiente, obteniendo
así dos imágenes. El suavizado del filtro gaussiano se obtiene promediando los valores de
intensidad de los píxeles en el entorno de vecindad con una mascara de convolución de media
cero y desviación estándar σ, la mascara gaussiana esta definida por la siguiente ecuación:
(x2+y2 2
G(x, y) = ke )/2σ (2)
El gradiente de una imagen f(x, y) en un punto (x, y) se
dado por la ecuación: [ ]define como un vector bidimensional
Gx
G[f(x, y)] = (3)
Gy
siendo el gradiente un vector perpendicular al borde, donde el vector G apunta en la dirección
de variación máxima de la función F en el punto (x, y), la magnitud y dirección están dadas
por dadas por:
√
|G| = G2
x +G2
y = |Gx|+ |Gy| (4)
Gy
Θ(x, y) = arctan (5)
Gx
siendo |G| la magnitud del gradiente y Θ(x, y) la dirección del gradiente.
5.2.2.3 Supresión de no-máximos al resultado del gradiente
Las imágenes generadas en el paso anterior sirven de entrada para generar una imagen con
los bordes adelgazados. El procedimiento es el siguiente, se consideran cuatro direcciones
identificadas por las orientaciones de 0◦, 45◦, 90◦y 135◦ con respecto al eje horizontal. Para cada
píxel se encuentra la dirección que mejor se aproxime a la dirección del ángulo de gradiente.
5.2.2.4 Histéresis de umbral
Del resultado del proceso anterior se obtiene una imagen que suele contener máximos locales
creados por el ruido. Una solución para eliminar dicho ruido es la histéresis basada en umbral.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 70
El proceso consiste en tomar la imagen obtenida del paso anterior, tomar la orientación de los
puntos de borde de la imagen y tomar dos umbrales, el primero más pequeño que el segundo.
Para cada punto de la imagen se debe localizar el siguiente punto de borde no explorado que
sea mayor al segundo umbral. A partir de dicho punto seguir las cadenas de máximos locales
conectados en ambas direcciones perpendiculares a la normal del borde siempre que sean may-
ores al primer umbral. Así se marcan todos los puntos explorados y se almacena la lista de todos
los puntos en el contorno conectado. Es así como en este paso se logra eliminar las uniones en
forma de Y de los segmentos que se unan en un punto.
5.2.2.5 Cierre de contornos abiertos
Como resultado del proceso anterior es posible hayan contornos abiertos, para poder cerrar estos
contornos se busca cada píxel uno de los ocho patrones posibles que delimitan la continuación
del contorno en tres direcciones posibles. Esto se logra con la convolución de cada píxel con
una máscara específica. Cuando alguno de los tres puntos es ya un píxel de borde se entiende
que el borde se ha cerrado, de lo contrario se elige el píxel con el valor máximo de gradiente
y se marca como nuevo píxel de borde y se aplica nuevamente la convolución. Estos pasos se
repiten para todo extremo abierto hasta encontrar su cierre o hasta llegar a cierto número de
iteraciones determinado.
Una vez detectado el contorno se procede a obtener algunas características que son:
• Diámetro máximo, es la mayor distancia existente entre dos puntos del contorno.
• Diámetro mínimo, es la distancia ortogonal desde el punto medio de la linea generada por
el diámetro máximo hacia el contorno.
• Área, pixeles contenidos en el contorno del parásito. Logra distinguir los parásitos grandes
de los pequeños
• Excentricidad, es la proporción existente entre el diámetro máximo y diámetro mínimo,
esta característica ayuda a diferenciar a los huevos de parásitos que son ovoides de los
circulares.
5.2.2.6 Características de textura interna Gray Level Occurrence Matrix
Esta técnica fue propuesta por (Lam, 1996) La matriz de co-ocurrencia describe la frecuencia de
un nivel de gris que aparece en una relación espacial especifica con otro valor de gris, dentro del
área de una ventana determinada. La matriz de co-ocurrencia es un resumen de la forma en que
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 71
los valores de los pixeles ocurren al lado de otro valor en una pequeña ventana. Normalmente
el procedimiento de generación de imágenes de textura requiere que el analista defina cinco
variables:
• Tamaño de la ventana
• Banda espectral de entrada
• Las texturas derivadas
• Cuantización (numero de bits) del canal de salida
• La componente espacial (la distancia interpixel y el ángulo para el computo de la co-ocurrencia).
Respecto del tamaño de la ventana, esta debe ser cuadrada y con numero impar de pixeles.
El resultado del calculo de la textura es un único numero que representa la ventana completa, el
cual es colocado en el lugar del pixel central. Luego, la ventana se mueve un pixel y el calculo
se repite calculando una nueva matriz de co-ocurrencia para esta nueva ventana y resultando
un nuevo valor, para el píxel central de esta nueva posición de la ventana. De este modo se
construye toda una nueva imagen con valores de texturas. Cada celda de la ventana debe situarse
en una celda que esté ocupada en la imagen original. Esto significa que el pixel central de la
ventana no puede ocupar un borde la imagen.
Las características de textura GLCM (Lam, 1996) están basadas en la matriz de co-ocurrencia
sobre la imagen segmentada en escala de grises. La matriz de co-ocurrencia es una matriz
cuadrada de N × N , donde N es el número de posibles valores en la imagen (niveles de gris),
La posiciónCij de la matriz representa la cantidad de pixeles de nivel i que están a una distancia
y en una dirección de otro pixel de nivel j.
Una vez obtenida la matriz de co-ocurrencia esta debe pasar por una normalización. Después
se debe escoger el descriptor apropiado que reducirá la matriz de co-ocurrencia a un solo valor
(En este caso un descriptor de contraste). Las pruebas fueron realizadas usando 8 niveles de
umbral y desplazamientos δx = 3, δy = 3. Las características calculadas son: correlación,
energía, contraste y homogeneidad.
La etapa de segmentación retorna imágenes recortadas contenedoras de candidatos con
background blanco, esta particularidad es aprovechada para descartar cualquier pixel blanco
del conteo para la matriz de co-ocurrencia garantizando así obtener características exclusiva-
mente del candidato en escala de grises.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 72
5.2.2.7 Características de Histograma
Los histogramas (Lin and Lin, 2011) son la representación de la distribución de la intensidad
de colores de una imagen, en una imagen en niveles de gris la propuesta tiene valores entre el
rango de [0, 255] donde 0 representa el color 0 y el valor de 255 es el blanco. Las características
extraídas mediante el histograma se obtiene contando las intensidades de cada pixel de la im-
agen. Entonces para reducir el numero de características el histograma puede ser representado
por cierta cantidad de bins, optimizando la cantidad de atributos de la imagen.
Los valores de los bins son calculados por el promedio de los valores del bucket del his-
tograma original, en ese caso las pruebas fueron realizados con 17 bins, cada bin es resultante
del promedio de un bloque de 15 unidades del histograma original.
5.2.2.8 Momentos de HU
En procesamiento de imágenes, los momentos invariantes son usados como un vector de car-
acterísticas para su clasificación de imágenes obteniendo atributos de las formas del objeto
basadas en su textura. En los años 1960, Hu (Hu, 1962) desarrolló 7 momentos invariantes de
escalas, rotación y traslación basados en momentos de teoría algebraica.
En reconocimiento de patrones se ha aplicado una leve modificación de estos momentos
invariantes para poder trabajar con imágenes y requiere de ser una matriz cuadrada para poder
obtener los 7 momentos de Hu como condición. Los momentos de Hu son 7 y están definidos
por las siguientes ecuaciones y son dependientes de sus anteriores ecuaciones:
ϕ1 = η20 + η02 (6)
ϕ2 = (η20 − η02)2 + 4η11 (7)
ϕ3 = (η30 − 3η 2 2
12) + (3η21 − η03) (8)
ϕ = (η 2 2
4 30 + η12) + (η03η21) (9)
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 73
[ ] [ ]
ϕ5 = (η30−3η12)(η30+η12) (η30+η
2
12) −(η21+η
2
03) +(3η21−η03)(η21+η03) 3(η 2 2
30+η12) −(η21+η03)
(10)
[ ]
ϕ6 = (η 2 2
20 − η02) (η30 + η12) − (η21 + η03) 4η11(η30 + η12)(η21 + η03) (11)
[ ] [ ]
ϕ7 = (3η21−η03)(η30+η12) (η +η )230 23 −3(η 2 2
21+η03) −(η30−3η12)(η03+η12) 3(η30+η12) −(η 2
21+η03)
(12)
5.2.2.9 Filtros de Gabor
Una filtro de Gabor es un complejo sinusoidal modulado por una envolvente Gaussiana. Para el
caso de dos dimensiones es una función compleja, sobre puesta a las dos partes del filtro los los
cuales solapados son equivalentes a una mascara.
Matemáticamente la función compleja de Gabor queda expresada de la siguiente manera:
2 2 2
g(x, y) = Ke(−π(a (x−x0) +b (y−y )20 ))e(j(2π(u0x+v0y)+P )) (13)
Y la parte real queda expresada como:
2 2 2
g(x, y) = Ke(−π(a (x−x0) +b (y−y0)2))e(cos(2π(u0x+v0y)+P )) (14)
Gabor a su vez otorga independencia de escala, rotación y traslación. La independencia
de escala es lograda dependiendo de un limite de escalas asignado al momento de extraer car-
acterísticas, la independencia de rotación es lograda por las múltiples rotaciones realizadas de
forma automática por Gabor teniendo como limite de rotaciones las asignadas al momento de
extraer características.
5.2.2.10 K-Gabor
Este extractor de características otorga una particularidad y ventaja para tipos de imágenes
que necesitan resaltar detalles de su morfología interna, tal es el caso en el reconocimiento de
parásitos ya que no basta con visualizar las características básicas pre-establecidas como alto,
ancho, área sino detalles internos para diferenciar entre especies de parásitos.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 74
Esta técnica se apoya en el uso de la clusterización por intensidad de grises usando K-means
para obtener diferentes niveles de contenido, para el presente caso de estudio se consideraron
5 clusters de los cuales el primer y ultimo cluster son descartados por contener información
global de la imagen, en cambio los clusters intermedios contienen información valiosa.
5.2.3 Redes complejas para la clasificación de parásitos
Para poder comparar el modelo propuesto frente a otros ya propuestos usando redes comple-
jas, se implementaron las otras técnicas en la clasificación de los parásitos, en ese sentido se
presentaran tres modelos de redes complejas para extracción del vector característico. Primero
explicaremos el modelo basado en los contornos, el modelo es el basado en la textura se imple-
mento según la propuesta de (Wesley, 2010) (Backes, 2010), finalmente el modelo propuesto es
descrito en detalle.
5.2.3.1 Red compleja basada en contorno
Este modelo se desarrollo en el marco del proyecto STIC-AMSUD (11STIC-07 - Webbased -
Web-based systems for bio-image analysis and interpretation) donde el modelo se desarrollo el
grupo de investigación del profesor Odermir Bruno de la Universidad de Sao Paulo - Brasil el
proceso puede ser visto en la figura 5.9:
Como se puede ver (figura 5.9), el método se basa en la detección del contorno externo y la
detección de los contornos de las estructuras internas. Para la detección del contorno externo
se realiza una binarización de la imagen usando el método propuesto por Otzu (Kurita et al.,
1992) una vez teniendo la imagen binarizada se extrae el contorno del parásito binarizado. Para
la detección de las estructuras internas se uso el algoritmo de Canny (Canny, 1986) y como ya
fue detectado el contorno externo este es eliminado quedando solo la estructura interna.
Como se puede ver en la siguiente figura 5.10 se muestra la figura de algunos parásitos de
de especies distintas donde el resultado de la obtención del borde exterior como de las estruc-
turas internas pueden ser apreciados siendo estas diferentes en su estructura interna eso ayuda
a compensar con dichas estructuras las texturas que ellos tienen.
Una vez teniendo el contorno se sigue la idea de construir la red según la distancia entre
los puntos del contorno donde los valores del umbral varia entre 0.05 a 0.95 con una variación
de umbral ∆T = 0.005 siendo un total de 190 intervalos de variación siendo dos vectores el
número total seria de 380 características, la propuesta obtiene dos vectores de características,
los valores del vector de características son el grado promedio de los nodos de la red.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 75
5.2.3.2 Red compleja basada en textura
Para poder construir la red primero see define una vecindad entre los pixels de la imagen for-
mando una red regular ya que todos los nodos de la red tienen el mismo grado, en ese sent√ido
se debe variar el parámetro de conectividad entre los pixeles, inicialmente el valor es de 2
una vez creada la red inicial para poder crear la red se considerara los niveles de intensidad
que tienen los pixeles calculando la diferencia de intensidades de tal manera que esta red tendrá
pesos w = |Ii−Ij| siempre y cuando los pixeles están conectados es decir que la distancia entre
los pixeles es menor que el radio definido inicialmente. Para convertir esta red regular con pesos
a una red compleja se usa valores umbrales T para conservar aristas con pesos menores a dicho
valor y eliminar aristas con valores mayores, en ese sentido varios umbrales son aplicados.
Una vez creada la red compleja se aplica las caminadas del turista obteniendo diferentes
memorias (µ1, ..., µM) y dinámicas mínimo y máximo son aplicadas en cada red compleja. el
vector de características es obtenida de la concatenación de los valores anteriores para diferentes
umbrales y distintos radios de conectividad.
5.2.4 Red compleja del modelo propuesto
Como se presento en capítulo 4 la red compleja del modelo propuesto es creada en función de la
distancia entre los valores de las posiciones de los pixeles y su valor de intensidad, una imagen
puede ser analizada de forma tridimensional, es decir que el punto 3D es la combinación de la
posición x, y y los niveles de intensidad I siendo estas posiciones los vertices en 3 dimensiones
(x, y, I) y en función a la distancia se establecerán las conexiones en la figura 5.11 se puede
apreciar la imagen correspondiente al parásito, además se puede ver su visualización en 3D,
también podemos ver dos redes construidas en función a dos distancias entre pixeles una es
d = 4. y el otro es d = 6 se puede ver claramente que a menor valor del umbral menor
conectividad existen entre vertices de la red, eso dice mucho del efecto que tiene el modelo
propuesto ante el cambio de umbral.
Por otro lado se puede ver también que las redes son diferentes eso indica que se pueden
diferenciar un tipo de otro eso es importante para las etapas siguientes de tal manera que garan-
tice la efectividad del método al momento de clasificar los parásitos.
Es importante considerar es que el modelo propuesto es invariante a las transformaciones ge-
ométricas eso garantiza la robustes de la propuesta, ya que ante el cambio en traslación rotación
o escala el valor del vector de características no se ve afectado, las transformaciones geométri-
cas mas comunes son la rotación, traslación y la escala en la figura 5.12 se puede ver el efecto
de rotar y escalar la imagen de una Enterobius Vermicularis, muy a pesar de las diferentes trans-
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 76
formaciones que sufrió la imagen, los vectores de características muestran valores semejantes
eso indica que el modelo es invariante a dichas transformaciones, eso hace robusto al modelo
ante este tipo de problemas.
Es importante tener en cuenta que el para poder construir la red compleja el fondo de la
imagen no es usada, para poder lograr dicho propósito la segmentación del parásito debe ser
realizada.
5.2.5 Clasificación de parásitos
Para poder clasificar los parásitos se tiene hacer una reducción de la dimensionalidad, usando
el CDA, una vez realizado el proceso de reducción podemos obtener las variables canónicas el
cual podemos apreciar en las siguientes figuras 5.13, 5.14.
Como se puede ver en la figura 5.13 al combinar la 8va y la 7ma variable se consigue una
separación aceptable entre las variables, pero el parásito Dyphillobothrium se sobrepone con
otros parásitos eso también sucede con la combinación de otras variables excepto en la combi-
nación de la 5ta variable con la 8va, es importante notar que en ese caso ese conjunto de datos
es fácilmente separable, se puede ver también que en varios casos los ascaris, Ucinarias, Faciola
hepatica y Enterobius vermicularis en varios casos es separable fácilmente eso indica que di-
chos parásitos son diferentes entre si. Se puede ver en general que las variables canónicas 1ra y
2da siempre presentan combinación de algunos parásitos lo que dificulta la clasificación. Pero
analizando las diferentes combinaciones también se puede ver que en algunos casos siempre
existe una separación de cada tipo de parásito.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 77
5.2.5.1 Resultados Estadísticos
Para validar el modelo propuesto se tuvo que realizar varias pruebas modificando el parámetro
principal que es la variación del delta δT ya que eso determina el nivel de conectividad de los
nodos de la red, donde hay que tomar en cuenta que a menor valor de δT mayor cantidad de
características. En la tabla 5.6 se puede ver la modificación del parámetro, de tal manera de
poder calibrar el modelo, también fueron probados diferentes kernels pero en los diferentes
experimento el polinomial fue el que presento mejores resultados. El parámetro fue variado
desde T = 0.01 hasta valores menores que T = 0.9 para diferentes δT .
∆T Nro. de carac- Nro. de imá- Porcentaje %
terísticas genes correctas Acierto
0.001 890 1023 98.74
0.002 445 1008 97.29
0.003 296 957 92.37
0.004 222 738 71.23
0.005 178 745 71.91
0.006 148 688 66.40
Tabla 5.5: Comparación de los resultados para diferentes parámetros del modelo propuesto.
Varios extractores de características han sido probados en el desarrollo de este proyecto, los
resultados obtenidos pueden ser resumidos en la siguiente tabla 5.6, puede verse que el modelo
propuesto consigue la mejor tasa de reconocimiento eso es importante por que muestra que usar
redes complejas se presentan como una solución promisoria en el area de reconocimiento de
patrones.
Extractor de Nro. de carac- Nro. de imá- Porcentaje %
Características terísticas genes correctas Acierto
Filtros de Gabor 48 994 95.94
Momentos de Hu 7 594 57.33
Histograma 17 869 83.88
Geometrico GLCM 8 971 93.72
GLCM 22 943 91.02
K = 2 Gabor 96 980 94.59
K = 3 Gabor 144 995 96.04
Contornos Red Compleja 390 1015 97.97
Textura Red Compleja 336 945 91.21
Modelo Propuesto 441 1023 98.74
Tabla 5.6: Comparación de los resultados para diferentes parámetros del modelo propuesto.
Es importante notar que los métodos basados en redes complejas tanto el método propuesto
como el método basado en contornos son los que mejores resultados ha obtenido, es por ese
motivo que mostraremos detalles del proceso de clasificación para eso usaremos las matrices de
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 78
confusion de dichos extractores como se puede ver en la tabla 5.7 se pueden ver los resultados
del modelo propuesto 5.7 y en la tabla 5.8 los resultados del modelo basado en contornos.
Como se puede ver en la figura 5.7 los parásitos 2 y 3 tienen algo de semejanza en forma
con otros parásitos, pero en textura son diferentes, en ese sentido es importante notar que el
modelo propuesto no cometió error en esos casos. Sin embargo el modelo basado en contornos
consiguió separar correctamente la clase 7; sin embargo el modelo cometió errores con con las
clases 1 y 4.
1 2 3 4 5 6 7 8 Co(%)
1 98.77 1.23 1.2
2 100
3 100
4 97.30 2.70 2.70
5 0.61 1.22 97.56 0.61 2.44
6 1.30 98.70 1.3
7 0.39 0.39 99.22 0.78
8 1.43 98.57 1.43
Om(%) 1.0 3.04 4.0 1.8 98.74
Tabla 5.7: Matriz de confusion, con sus respectivos error por cada clase de la clasificación del
método propuesto a los 8 especies de parásitos helmintos.
En resumen, los resultados obtenidos son muy alentadores en el sentido de que las redes
complejas si se pueden usar para el reconocimiento de patrones uní y bí dimensionales, posi-
bilitando resolver problemas reales como el diagnóstico de especies de parásitos helmintos, los
resultados demuestran que si es posible usar redes complejas para la caracterización de parási-
tos.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 79
Figura 5.9: Propuesta para la clasificación de los parásitos Helmintos
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 80
Figura 5.10: Contornos externos e internos de los diferentes parásitos
1 2 3 4 5 6 7 8 Co(%)
1 96.30 2.70 1.22 0.87 1.2
2 1.23 98.04 0.94 3.05 0
3 98.11 1.43 0
4 1.23 95.95 0.43 2.7
5 1.23 1.96 1.35 95.73 0.43 2.4
6 98.27 1.3
7 100 0.8
8 0.94 98.57 0
Om(%) 3.70 1.96 1.89 4.05 4.27 1.73 1.43 98.7
Tabla 5.8: Matriz de confusion, cons sus respectivos error por cada clase, para el modelo basado
en contornos.
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 81
Figura 5.11: Imagen micrográfica del parásito también se puede ver su visualización en 3D, y
dos redes generadas para dos parametros distintos cuando la distancia vale 4 y cuando vale 6
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 82
Figura 5.12: Enterobius Vermiculares con problemas de transformaciones geométricas, se
puede ver que su vector de características para las diferentes transformaciones geométricas
son muy parecidas eso hace al método robusto ante problemas de rotación y escala, (a) Re-
ducida de tamaño al 50% del tamaño original, (b) Imagen Original, (c) Aumentada de tamaño
al 150 %, (d) Imagen rotada y aumentada 150 %, (e) Imagen normal rotada, (f) Imagen rotada
y disminuida de tamaño
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 83
Figura 5.13: Análisis de las variables canónicas se pueden ver la combinación de la 8va variable
combinada con la 7ma, 6ta, 5ta, 4ta, 3ra, 2da, 1ra. Y 3ra combinada con las variables 2da, 1ra
5.2. RECONOCIMIENTO DE PARÁSITOS HELMINTOS 84
Figura 5.14: Visualización de la variable 7ma con la 6ta, 5ta, 4ta, 2da, 1ra variable. También
vemos la 4ta y 3ra, 2da, 1ra. Además la 6ta combinada con 5ta, 4ta, 2da, 1ra finalmente la 5ta
variable combinada con 4ta, 3ra, 2da, 1ra
CAPÍTULO
6
Conclusiones
6.1 Discusión sobre el modelos propuesto
Es importante tener en cuenta algunos aspectos que hacen que esta propuesta sea innovadora en
referencia a los modelos existentes
• La ida de esta propuesta es innovadora ya que según se revisaron los trabajos relacionados
no son similares al modelo propuesto, a pesar de ser una idea sencilla en su concepción
demostró ser potente para extracción de características de series temporales e imágenes.
• En cuanto a las series temporales la mayoría de los trabajos buscan representar redes
complejas enfocadas preservar las características de la naturaleza de la serie característi-
cas como aleatoriedad en caso de series aleatorias, así como periodicidad buscando cor-
relaciones y ciclos repetidos o pseudo repetidos para la creación de las mismas, e incluso
hay técnicas para preservar sus comportamiento de dinámicas complejas como lo es el
comportamiento caótico.
• En cuanto a la generalidad del modelo se puede notar que ya sea bidimensional o tridi-
mensional el modelos seria extensible a una dimension mayor, por ejemplo si se tuviera
una base de datos de imágenes 3D donde se tiene el concepto de voxel el cual tiene una
posición 3D x, y, z además de tener un valor de intensidad (color) asociado entonces la
propuesta de moderamiento seria la misma ya que cada nodo de la red seria la posición
85
6.2. CONCLUSIONES 86
4D x, y, z, I y la conectividad de la misma estará dada por distancia entre sus vertices
para diferentes umbrales y así crear diferentes redes.
• Para el caso de modelos para imágenes la propuesta presenta una ventaja clara ya que
normalmente se intenta resaltar características por separado de las imágenes, como lo es
la forma y la textura proponiendo modelos por separado sin embargo podemos ver que
en la propuesta cuando los niveles de distancia (Umbral) entre nodos es baja la forma de
las estructuras ya sean internas o externas son resaltas y cuando los niveles de distancia
son mayores la textura de la imagen es caracterizada, por lo tanto se puede decir que el
modelo es mas completo al considerar ambos aspectos a la vez. Ahora si por el contrario
se quisiese resaltar uno de los aspectos mas que otro (forma o textura), el modelo debería
ajustar el calculo de la distancia dando mayor valor al parámetro alfa o beta.
• El modelo propuesto para imágenes fue probado solo para imágenes en niveles de grises si
se quiere extender a color el modelo seria extensible de forma natural, ya que la posición
de un nodo seria el valor x, y del pixel mas el valor del color el cual puede ser colocado
en un universo de color especifico por ejemplo para el domino R G B, siendo la posición
final del nodo (x, y, R,G,B) y lo siguiente es calcular distancia entre los nodos usando
diferentes umbrales de distancias.
6.2 Conclusiones
Como pudo ser demostrado en el capitulo de resultados las redes complejas pueden ser uti-
lizados en el reconocimiento de patrones unidimensionales y bidimensionales, esto demuestra
la potencialidad del uso de las redes complejas en la solución de problemas reales, donde se
presentaron dos aplicaciones una en el reconocimiento de palabras habladas y la otra en el
reconocimiento de imágenes de parásitos helmintos.
En el caso del reconocimiento de palabras habladas se demostró como una serie temporal
puede ser estudiada desde el punto de vista topológico analizando sus propiedades, y usar dichas
propiedades para caracterizar y diferenciar señales temporales, mostrando porcentajes altos en
el reconocimiento llegando a un 99.44%, además el modelo es robusto ya que el principal
parámetro (variación de los umbrales) da tasas de reconocimiento altas para diferentes valores,
eso de muestra que el método no es una solución particular, por el contrario da buenos resultados
para diferentes valores.
En el caso de reconocimiento de imágenes se ha demostrado que los método basados en
redes complejas obtienen mejores resultados que técnicas tradicionales ampliamente usadas
en el reconocimiento de imágenes como los son los filtros de Gabor, eso es importante ya
6.3. RECOMENDACIONES 87
que la propuesta se presenta como una nueva alternativa de solución a distintos problemas de
reconocimiento de imágenes
Las propuestas basadas en redes complejas, se presentan como un campo potencial de apli-
cación en reconocimiento de patrones en general, la idea central es ver como el patron puede
ser representado como una red compleja, en ese sentido es importante que las características
del patron se vean reflejados en la representación por red, además nuevas características pueden
ser analizadas a partir del grafo. Un siguiente paso es ver que medida podría ser usada para
caracterizar y diferenciar los diferentes patrones, en la actualidad existen muchas medidas que
podrían usarse es importante hacer un análisis cuantitavo de las diferentes métricas usadas en
ese sentido es importante usar una maquina de aprendizaje para poder realizar dicha selección.
6.3 Recomendaciones
Una de las cosas que es importante notar es que el tamaño del patron es una aspecto que se debe
considerar ya que tanto una imagen como un sonido son muestreados a diferentes tamaños,
cuando una imagen es de gran tamaño hace que el numero de cálculos necesarios para extraer
el vector de características tomarían un tiempo considerable, incluso se tendría que considerar
una capacidad minima de memoria para poder procesar el patron.
En las aplicaciones presentadas tanto las imágenes como el archivo de sonido son soportados
por el computador pero imágenes de mayor resolución podrían desbordar la memoria. En esos
casos podría usarse técnicas de disminución del tamaño original. Por ejemplo en el caso de una
imagen se puede reducir el tamaño de una imagen, manteniendo las características originales de
forma y textura lo cual puede ser realizado de forma perceptual observando la imagen original y
sus reducciones, fue presentado en los resultados que el modelo es invariante a la transformación
de escala, claro que esa escala tiene una tolerancia para el caso de los parásitos un tamaño
mínimo de 50×50 pixels de resolución garantizando que el modelo presente buenos resultados.
En el caso de los archivos de sonido, es importante tomar en consideración que las graba-
ciones de sonido tienen intervalos de tiempo que corresponden a la palabra hablada así como
intervalos de silencio que no son necesarios en el reconocimiento y que por el contrario al-
teran el calculo de las características, pero eso es superado usando técnicas de detección de
inicio y fin de palabra, lo cual es lógico y es un paso usado también por cualquier técnica de
reconocimiento de palabras habladas.
Revisando la literatura uno puede notar la existencia de diferentes propuestas en la repre-
sentación de los patrones como redes complejas, eso muestra que las redes complejas presentan
flexibilidad y variedad de su uso en el reconocimiento de patrones. Es importante notar que la
6.4. TRABAJOS FUTUROS 88
propuesta es original a pesar de ser una idea simple puede usarse tanto unidimensional como
bidimensionalmente.
6.4 Trabajos Futuros
Diferentes aplicaciones en reconocimiento de imágenes pueden ser usadas por ejemplo en el
reconocimiento de rasgos biométricos como reconocimiento de iris o de rostros, las cuales son
problemas abiertos y ampliamente estudiados que ayudarían a mostrar la potencial aplicabilidad
del modelo presentado además de delimitar las limitaciones del modelo lo cual es importante
para aplicaciones reales.
En el caso de aplicar el modelo en el reconocimiento de palabras habladas el modelo no
fue comparado otras técnicas por eso seria importante cuantificar las diferencias con métodos
tradicionales para así cuantificar el desempeño real de la propuesta.
La propuesta fue probada para patrones unidimensionales y bidimensionales en ese sentido
podría ser usado para patrones tridimensionales usando el concepto del voxel lo cual seria una
extension natural del modelo propuesto, la diferencia entre las aplicaciones anteriores seria
minima, seria interesante mostrar una aplicación en esa area que hoy en día es posible ya que
varios dispositivos permiten tener patrones en esa dimension (imágenes 3D).
Referencias Bibliográficas
Albert, R., Jeong, H., and Barabási, A. (2000). Error and attack tolerance of complex networks.
Nature, 406(6794):378–382.
Aldana, M. (2006). Tutorial redes complejas. Technical report, Instituto de Ciencias Físicas
UNAM. http://www. fis. unam. mx/˜ max/English/notasredes.pdf.
Aldana, M. and Cluzel, P. (2003). A natural class of robust networks. Proceedings of the
National Academy of Sciences of the United States of America, 100(15):8710.
Amancio, D. R., Nunes, M. G., Oliveira Jr, O. N., and Costa, L. d. F. (2012). Extractive
summarization using complex networks and syntactic dependency. Physica A: Statistical
Mechanics and its Applications, 391(4):1855–1864.
Backes, A., Casanova, D., and Bruno, O. (2009). A complex network-based approach for
boundary shape analysis. Pattern Recognition, 42(1):54–67.
Backes, A., Gonçalves, W., Martinez, A., and Bruno, O. (2010). Texture analysis and classifi-
cation using deterministic tourist walk. Pattern Recognition, 43(3):685–694.
Backes, R. (2010). Estudos de Metodos de Analise de complexidade em imagenes. PhD thesis,
Instituto de Ciencias Matematicas e de Computacao - USP Brasil.
Barabási, A., Albert, R., and Jeong, H. (2000). Scale-free characteristics of random networks:
the topology of the world-wide web. Physica A: Statistical Mechanics and its Applications,
281(1-4):69–77.
Barabasi, A. and Crandall, R. (2003). Linked the new science of networks. American journal
of Physics, 71:409.
89
REFERENCIAS BIBLIOGRÁFICAS 90
Bialonski, S. (2012). Inferring complex networks from time series of dynamical systems: Pit-
falls, misinterpretations, and possible solutions. arXiv preprint arXiv:1208.0800.
Boccaletti, S., Latora, V., Moreno, Y., Chavez, M., and Hwang, D. (2006). Complex networks:
Structure and dynamics. Physics reports, 424(4-5):175–308.
Box, G., Jenkins, G., and Reinsel, G. (1976). Time series analysis: forecasting and control.
Holden-day San Francisco.
Campanharo, A. S., Sirer, M. I., Malmgren, R. D., Ramos, F. M., and Amaral, L. A. N. (2011).
Duality between time series and networks. PloS one, 6(8):e23378.
Canny, J. (1986). A computational approach to edge detection. Pattern Analysis and Machine
Intelligence, IEEE Transactions on, 8(6):679–698.
Chatfield, C. (2003). The analysis of time series: an introduction. CRC Pr I Llc.
Chuctaya, J., Mena, J., Humpire, G., Rodriguez, A., Beltrán, C., and Patino, R. (2010). Detec-
ción de huevos helmintos mediante plantillas dinámicas. Conferencia Latinoamericana de
Informática CLEI, pages 1–12.
Costa, L., Rodrigues, F., Travieso, G., and Boas, P. (2007). Characterization of complex net-
works: A survey of measurements. Advances in Physics, 56(1):167–242.
Davidsen, J., Grassberger, P., and Paczuski, M. (2005). Earthquake recurrence as a record
breaking process. Arxiv preprint physics/0507082.
de Angelis André, F. (2005). Tutorial redes complexas. Techni-
cal report, Fundação de Amparo à Pesquisa do Estado de São Paulo.
www.ft.unicamp.br/∼andre/Gerais/Tutorial_RedesComplexas.pdf.
Dellnitz, M., Molo, M., Metzner, P., Preis, R., and Sch
"utte, C. (2006). Graph algorithms for dynamical systems. Analysis, modeling and simulation
of multiscale problems, pages 619–645.
Donner, R., Hinrichs, U., and Scholz-Reiter, B. (2008). Symbolic recurrence plots: A new
quantitative framework for performance analysis of manufacturing networks. The European
Physical Journal-Special Topics, 164(1):85–104.
Donner, R. V., Zou, Y., Donges, J. F., Marwan, N., and Kurths, J. (2010). Recurrence network-
sŮa novel paradigm for nonlinear time series analysis. New Journal of Physics, 12(3):033025.
Fabricio, A. (2010). Aprendizado de maquina en redes complexas. PhD thesis, Instituto de
Ciencias Matematicas e de Computacao USP Brasil.
REFERENCIAS BIBLIOGRÁFICAS 91
Ferreira, D. S., Papa, A., and Menezes, R. (2013). The small world of seismic events. arXiv
preprint arXiv:1304.4979.
Flint, J., Van Duynhoven, Y., Angulo, F., DeLong, S., Braun, P., Kirk, M., Scallan, E., Fitzger-
ald, M., Adak, G., Sockett, P., et al. (2005). Estimating the burden of acute gastroenteritis,
foodborne disease, and pathogens commonly transmitted by food: an international review.
Clinical infectious diseases, 41(5):698–704.
Franses, P. and Van Dijk, D. (2000). Nonlinear time series models in empirical finance. Cam-
bridge Univ Pr.
Hidalgo, C. (2010). The value in the links: Networks and the evolution of organizations. Natural
Science of Networks.
Hirata, Y., Horai, S., and Aihara, K. (2008). Reproduction of distance matrices and original time
series from recurrence plots and their applications. The European Physical Journal Special
Topics, 164(1):13–22.
Hu, M. (1962). Visual pattern recognition by moment invariants. Information Theory, IRE
Transactions on, 8(2):179–187.
Humpire, G., Chuctaya, J.and Gutierrez, J. C., Bruno, O., and Beltrán, C. (2011). Detección de
huevos helmintos mediante plantillas dinámicas. Visão Computacional em Bioinformática.
Keeling, M. and Eames, K. (2005). Networks and epidemic models. Journal of the Royal
Society Interface, 2(4):295.
Keogh, E., Chu, S., Hart, D., and Pazzani, M. (2004). Segmenting time series: A survey and
novel approach. World Scientific Publishing.
Kim, H. and Kim, J. (2005). Cyclic topology in complex networks. Arxiv preprint
physics/0503168.
Kurita, T., Otsu, N., and Abdelmalek, N. (1992). Maximum likelihood thresholding based on
population mixture models. Pattern Recognition, 25(10):1231–1240.
Lacasa, L., Luque, B., Ballesteros, F., Luque, J., and Nuño, J. C. (2008). From time series to
complex networks: The visibility graph. Proceedings of the National Academy of Sciences,
105(13):4972–4975.
Lam, S. (1996). Texture feature extraction using gray level gradient based co-occurence matri-
ces. In Systems, Man, and Cybernetics, 1996., IEEE International Conference on, volume 1,
pages 267–271. IEEE.
REFERENCIAS BIBLIOGRÁFICAS 92
Latora, V. and Marchiori, M. (2001). Efficient behavior of small-world networks. Physical
Review Letters, 87(19):198701.
Liao, W. et al. (2005). Clustering of time series data–a survey. Pattern Recognition,
38(11):1857–1874.
Lin, C. and Lin, W. (2011). Image retrieval system based on adaptive color histogram and
texture features. The Computer Journal, 54(7):1136–1147.
Luque, B., Lacasa, L., Ballesteros, F., and Luque, J. (2009). Horizontal visibility graphs: Exact
results for random time series. Physical Review E, 80(4):046103.
Marina, M. J. and Carlos, G. C. J. (2010). Modelamiento de red compleja para el análisis de
comunidades en twitter. Proceedings, CSPC-2010 IX Congreso de la Sociedad Peruana de
Computación, pages 113–122.
Marwan, N., Donges, J., Zou, Y., Donner, R., and Kurths, J. (2009). Complex network approach
for recurrence analysis of time series. Physics Letters A, 373(46):4246–4254.
Newman, M. (2001). Scientific collaboration networks. i. network construction and fundamen-
tal results. Physical review E, 64(1):016131.
Newman, M. (2003). The structure and function of complex networks. SIAM review,
45(2):167–256.
P., E. and A., R. (1959). On random graphs. Publicationes Matematicae, 6:290–297.
Pagani, G. A. and Aiello, M. (2013). The power grid as a complex network: a survey. Physica
A: Statistical Mechanics and its Applications.
Pardo, T., Antiqueira, L., das Gracas Nunes, M., Oliveira, O., and da Fontoura Costa, L.
(2006). Using complex networks for language processing: The case of summary evalua-
tion. In Communications, Circuits and Systems Proceedings, 2006 International Conference
on, volume 4, pages 2678–2682. IEEE.
Parker, J. (2010). Algorithms for image processing and computer vision. Wiley.
Ravasz, E. and Barabási, A. (2003). Hierarchical organization in complex networks. Physical
Review E, 67(2):026112.
Reijneveld, J., Ponten, S., Berendse, H., and Stam, C. (2007). The application of graph theoreti-
cal analysis to complex networks in the brain. Clinical Neurophysiology, 118(11):2317–2331.
REFERENCIAS BIBLIOGRÁFICAS 93
Rubinov, M. and Sporns, O. (2010). Complex network measures of brain connectivity: uses
and interpretations. Neuroimage, 52(3):1059–1069.
Salas, J. and Delleur, J. (1980). Applied modeling of hydrologic time series. Water Resources
Publication.
Tan, H., Gelfand, S., and Delp, E. (1989). A comparative cost function approach to edge
detection. Systems, Man and Cybernetics, IEEE Transactions on, 19(6):1337–1349.
Vapnik, V. (2000). The nature of statistical learning theory. Springer-Verlag New York Inc.
Wang, D. (2011). Multifractal characterisation and analysis of complex networks.
Watts, D. and Strogatz, S. (1998a). Collective dynamics of Śsmall-worldŠnetworks. nature,
393(6684):440–442.
Watts, D. and Strogatz, S. (1998b). Small world. Nature, 393:440–442.
Wesley, N. (2010). Caminhadas deterministicas em redes complexas, aplicda en visao com-
putacional. PhD thesis, Instituto de Ciencias Matematicas e de Computacao - USP Brasil.
Xu, X., Zhang, J., and Small, M. (2008). Superfamily phenomena and motifs of net-
works induced from time series. Proceedings of the National Academy of Sciences,
105(50):19601–19605.
Yang, Y. and Yang, H. (2008). Complex network-based time series analysis. Physica A: Statis-
tical Mechanics and its Applications, 387(5-6):1381–1386.
Zhang, J. (2007). Detecting and describing pseudo-periodic dynamics from time series.
Zhang, J. and Small, M. (2006). Complex network from pseudoperiodic time series: Topology
versus dynamics. Physical review letters, 96(23):238701.
Zhang, J., Sun, J., Luo, X., Zhang, K., Nakamura, T., and Small, M. (2008). Characterizing
pseudoperiodic time series through the complex network approach. Physica D: Nonlinear
Phenomena, 237(22):2856–2865.