Publicación:
Generación genética multiobjetivo de bases de conocimiento Fuzzi para clasificación en bases de datos no balanceados usando el enfoque iteractivo.
Generación genética multiobjetivo de bases de conocimiento Fuzzi para clasificación en bases de datos no balanceados usando el enfoque iteractivo.
Fecha
2015-08
Autores
Hinojosa Cardenas, Edward
Título de la revista
Revista ISSN
Título del volumen
Editor
Universidad Nacional de San Agustín de Arequipa
Proyectos de investigación
Unidades organizativas
Número de la revista
Abstracto
Los sistemas fuzzy han sido utilizados para resolver diversos tipos de problemas, entre ellos los problemas de clasificación, dado que pueden obtener alta precisión e interoperabilidad. Los algoritmos genéticos, métodos adaptativos definidos así porque se inspiran en la evolución biológica y tiene base genético-molecular, son uno de los tipos de algoritmos evolutivos más utilizados para generar u optimizar alguno(s) o todos los componentes de los sistemas fuzzy de forma automática a partir de datos o información previa. Dentro de esa ´área de investigación, definida como sistemas fuzzy genéticos, existen diferentes tendencias de investigación, entre ellas tenemos dos de interés para este trabajo: (i) el uso de algoritmos genéticos multiobjetivo para generar sistemas fuzzy con equilibrio entre precisión e intepretabilidad. Los algoritmos genéticos multiobjetivo son una extensión de los algoritmos genéticos y se caracterizan porque la búsqueda de soluciones que balancean objetivos contradictorios está embebida en el mismo algoritmo; y (ii) utilizar los sistemas fuzzy para resolver el problema de clasificación en bases de datos no balanceadas. Estas bases de datos se caracterizan porque las clases no son representadas por la misma o similar cantidad de ejemplos, y son de particular interés porque muchos problemas de clasificación del mundo se caracterizan por tener una gran cantidad de ejemplos típicos o normales (clase negativa) y un pequeño porcentaje de ejemplos atípicos o relevantes (clase positiva); esa diferencia entre las clases hace que el aprendizaje de modelos de clasificación sea una tarea difícil y sea un tema en abierto en la comunidad de investigación de aprendizaje de máquina. Conforme a las dos tendencias mencionadas anteriormente, este trabajo propone un método de generación genética multiobjetivo de la base de conocimiento fuzzy, de sistemas fuzzy basados en reglas (un tipo de sistemas fuzzy), para la clasificación en bases de datos no balanceadas usando el enfoque iterativo. El enfoque iterativo es utilizado específicamente en la generación de reglas fuzzy, dado que una regla fuzzy es obtenida en cada ejecución del algoritmo genético multiobjetivo. El método propuesto se basa en tres fases: (i) el pre procesamiento, en este caso balanceamiento, de los datos no balanceados utilizando técnica de sobre muestro, submuestreo e híbridos; (ii) la generación genética multiobjetivo iterativa de reglas fuzzy considerando dos objetivos, la precisión o tasa de clasificación y la interpretabilidad o cantidad de condiciones de cada regla fuzzy; (iii) y la optimización genética multiobjetivo de los conjuntos fuzzy considerando dos objetivos, la precisión o tasa de clasificación y un índice de interpretabilidad semántica basada en el desplazamiento y la diferencia de las áreas de los conjuntos fuzzy originales e optimizados. Los resultados obtenidos muestran que el método propuesto tiene un buen desempeño, superando en precisión a otros métodos que realizan la misma tarea encontrados en la literatura. La principal contribución del método propuesto, incluso mayor que la precisión, es la menor cantidad total de condiciones obtenidas en comparación a los otros métodos, y por lo tanto una menor complejidad de los sistemas de clasificación fuzzy obtenidos para bases de datos no balanceadas.
Descripción
Palabras clave
Programación informática,
Algoritmo,
Base de datos