Publicación:
(Delta) - radius IVRL: paradigma de integración de aprendizaje por refuerzo en sistemas multi-agente

No hay miniatura disponible
Fecha
2016
Autores
Camargo Monroy, Jesús Alejandro
Título de la revista
Revista ISSN
Título del volumen
Editor
Universidad Católica San Pablo
Proyectos de investigación
Unidades organizativas
Número de la revista
Abstracto
Los sistemas multi-agente han mostrado, por su propia naturaleza, permitir resolver problemas que requieren coordinaci´on y/o cooperaci´on, ello por cuanto permiten representar de forma natural dichas situaciones. Sin embargo, existen algunos problemas relacionados a su representaci´on formal y en consecuencia a su aplicacio´n. El estudio de los modelos formales actuales ha dejado al descubierto algunas de las falencias respecto a su representacio´n y aplicaci´on; con un fallido sistema de comunicaci´on como el problema mayor comu´nmente encontrado. Estando al tanto de este problema proponemos : δ-radius Communication Model, una representacio´n formal para la comunicaci´on en sistemas multi-agente. Los paradigmas dominantes de aprendizaje en el a´rea son Independent Learning e Influence Value Reinforcement Learning. Polos opuestos en relacio´n a la influencia de los agentes respecto a sus compan˜eros. Independent Learning busca establecer un sistema libre de influencia; mientras tanto, Influence Value Reinforcement Learning presenta un escenario en el cual los agentes son influenciados por todos sus compan˜eros en un entorno compartido. Basa´ndonos en ambos extremos, una vista unificada de ambos paradigmas es definida: δ-radius Influence Value Reinforcement Learnig. La visio´n unificada ha de permitir el desarrollo de sistemas intermedios, en los cuales se pueda definir limitaciones expl´ıcitas a la comunicacio´n mediante una nocio´n de distancia entre los agentes y teniendo como limitante a δ, una variable que determinara la distancia ma´xima bajo la cual es posible establecer comunicaci´on entre dos agentes. M´as aun, los resultados de los experimentos desarrollados han demostrado que los sistemas intermedios han de tener una menor complejidad algor´ıtmica y una mejor capacidad de convergencia.
Descripción
Palabras clave
Sistema Multi-Agente, Independent Learning
Citación