Please use this identifier to cite or link to this item: http://bibdigital.epn.edu.ec/handle/15000/20854
Title: Diseño e implementación de una arquitectura multi agente para comunicar conocimientos de aprendizaje por refuerzo y mejorar el comportamiento de los agentes
Authors: Cárdenas Guilcapi, David Alexander
Keywords: COMPUTACIÓN
CIENCIAS
SISTEMA MULTI AGENTE
Issue Date: 11-May-2020
Publisher: Quito, 2020.
Citation: Cárdenas Guilcapi, D. A. (2020). Diseño e implementación de una arquitectura multi agente para comunicar conocimientos de aprendizaje por refuerzo y mejorar el comportamiento de los agentes. 37 hojas. Quito : EPN.
Abstract: This research project presents a multi agent architecture which uses reinforcement learning. The goal is to design a system that able the agents take advantage of its peers’ knowledge. The knowledge of the environment is obtained from the reinforcement learning algorithm, Q-learning. While, the multi agent architecture sets a communication model between the agents of the system. To reach the goal, the present research project takes advantage of the Q-learning characteristic, off-policy, incorporating a condition before the use of ε-greedy. This condition allows the agents not to explore a state that has already been sent by another agent, or itself. In the proposed multi agent architecture the agents work in pairs. Each pair of agents have two different behaviors allowing them to communicate and work on relevant states of the environment. The conditions to send the states depend on the environment, specifically, it depends on the circumstances which the agent obtains a reward from the environment. The results of this work show that through the proposed architecture, the number agent-environment interactions that the agents need to improve their behavior is reduced by more than 90%.
Description: El presente trabajo presenta una arquitectura multi agente que utiliza aprendizaje por refuerzo. El objetivo es diseñar un sistema que permita a los agentes aprovechar el conocimiento de sus similares. El conocimiento del ambiente es obtenido a partir del algoritmo de aprendizaje por refuerzo, Q-learning. La arquitectura multi agente establece un modelo de comunicación entre los agentes del sistema. Para alcanzar el objetivo, el presente trabajo de investigación aprovecha la característica off-policy de Q-learning incorporando una condición antes de utilizar ε-greedy. Esta condición permite que los agentes no exploren un estado que ya ha sido comunicado por otro o por el mismo agente. En la arquitectura multi agente propuesta los agentes trabajan en pares. Cada par de agentes representa dos comportamientos diferentes que les permiten comunicar y operar sobre estados relevantes del ambiente. Las condiciones para comunicar los estados varían dependiendo del ambiente, específicamente, dependen de las circunstancias en las que el agente obtiene una recompensa del ambiente. Los resultados del presente trabajo de titulación muestran que, utilizando la arquitectura propuesta, el número de interacciones agente-ambiente que requieren los agentes para mejorar su comportamiento se reduce en más de un 90%.
URI: http://bibdigital.epn.edu.ec/handle/15000/20854
Appears in Collections:Tesis Sistemas Informáticos y de Computación (ISIS)

Files in This Item:
File Description SizeFormat 
CD 10375.pdf925,08 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.