Por favor, use este identificador para citar o enlazar este ítem: http://bibdigital.epn.edu.ec/handle/15000/20854
Título: Diseño e implementación de una arquitectura multi agente para comunicar conocimientos de aprendizaje por refuerzo y mejorar el comportamiento de los agentes
Autor: Cárdenas Guilcapi, David Alexander
Palabras clave: COMPUTACIÓN
CIENCIAS
SISTEMA MULTI AGENTE
Fecha de publicación: 11-may-2020
Editorial: Quito, 2020.
Citación: Cárdenas Guilcapi, D. A. (2020). Diseño e implementación de una arquitectura multi agente para comunicar conocimientos de aprendizaje por refuerzo y mejorar el comportamiento de los agentes. 37 hojas. Quito : EPN.
Resumen: This research project presents a multi agent architecture which uses reinforcement learning. The goal is to design a system that able the agents take advantage of its peers’ knowledge. The knowledge of the environment is obtained from the reinforcement learning algorithm, Q-learning. While, the multi agent architecture sets a communication model between the agents of the system. To reach the goal, the present research project takes advantage of the Q-learning characteristic, off-policy, incorporating a condition before the use of ε-greedy. This condition allows the agents not to explore a state that has already been sent by another agent, or itself. In the proposed multi agent architecture the agents work in pairs. Each pair of agents have two different behaviors allowing them to communicate and work on relevant states of the environment. The conditions to send the states depend on the environment, specifically, it depends on the circumstances which the agent obtains a reward from the environment. The results of this work show that through the proposed architecture, the number agent-environment interactions that the agents need to improve their behavior is reduced by more than 90%.
Descripción: El presente trabajo presenta una arquitectura multi agente que utiliza aprendizaje por refuerzo. El objetivo es diseñar un sistema que permita a los agentes aprovechar el conocimiento de sus similares. El conocimiento del ambiente es obtenido a partir del algoritmo de aprendizaje por refuerzo, Q-learning. La arquitectura multi agente establece un modelo de comunicación entre los agentes del sistema. Para alcanzar el objetivo, el presente trabajo de investigación aprovecha la característica off-policy de Q-learning incorporando una condición antes de utilizar ε-greedy. Esta condición permite que los agentes no exploren un estado que ya ha sido comunicado por otro o por el mismo agente. En la arquitectura multi agente propuesta los agentes trabajan en pares. Cada par de agentes representa dos comportamientos diferentes que les permiten comunicar y operar sobre estados relevantes del ambiente. Las condiciones para comunicar los estados varían dependiendo del ambiente, específicamente, dependen de las circunstancias en las que el agente obtiene una recompensa del ambiente. Los resultados del presente trabajo de titulación muestran que, utilizando la arquitectura propuesta, el número de interacciones agente-ambiente que requieren los agentes para mejorar su comportamiento se reduce en más de un 90%.
URI: http://bibdigital.epn.edu.ec/handle/15000/20854
Tipo: bachelorThesis
Aparece en las colecciones:Tesis Sistemas Informáticos y de Computación (ISIS)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
CD 10375.pdf925,08 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.