Título: | Extendiendo Darmok, un sistema de planificación basada en casos, mediante Árboles de comportamiento |
Autores: | Palma Durán, Ricardo |
Tipo de documento: | texto impreso |
Fecha de publicación: | 2010 |
Dimensiones: | application/pdf |
Nota general: |
cc_by_nc info:eu-repo/semantics/openAccess |
Idiomas: | |
Palabras clave: | Estado = No publicado , Materia = Ciencias: Informática: Sistemas expertos , Tipo = Trabajo Fin de Máster |
Resumen: |
La combinación de aprendizaje automático y planificación ha demostrado ser una buena solución para los juegos de estrategia en tiempo real. Sin embargo, aprender planes jerárquicos a partir de trazas (demostraciones) de expertos tiene también sus limitaciones, en particular el número de trazas de entrenamiento necesitadas, así como la ausencia de mecanismos para reaccionar rápidamente ante objetivos de alta prioridad. En este trabajo proponemos que el diseñador defina de manera explícita conocimiento para la toma de decisiones en forma de árboles de comportamiento, para así complementar el conocimiento obtenido a partir de las trazas. Proporcionando un mecanismo natural para que los diseñadores inyecten conocimiento en la librería de planes, pretendemos integrar lo mejor de ambos enfoques: aprendizaje de trazas y reglas codificadas a mano. En este trabajo extendemos un sistema de planificación basada en casos, Darmok, para resolver algunos de sus problemas más importantes. Darmok, que fue diseñado para jugar a juegos de estrategia en tiempo real, tiene algunas deficiencias en lo que respecta a su capacidad de reactividad. En concreto, puede ser o demasiado reactivo cuando ejecuta algunos planes, o demasiado no-reactivo en la ejecución de algunas acciones de bajo nivel, lo cual en su conjunto hace que su rendimiento se deteriore en algunos escenarios bastante frecuentes. Mediante el uso de conocimiento experto en forma de árboles de comportamiento, pretendemos solventar estos problemas. [ABSTRACT] The combination of learning and planning has proved an efective solution for real-time strategy games. Nevertheless, learning hierarchical plans from expert traces also has its limitations, regarding the number of training traces required, and the absence of mechanisms for rapidly reacting to high priority goals. We propose to bring the game designer back into the loop, by allowing him to explicitly inject decision making knowledge, in the form of behavior trees, to complement the knowledge obtained from the traces. By providing a natural mechanism for designers to inject knowledge into the plan library, we intend to integrate the best of both worlds: learning from traces and hardcoded rules. In this work we extend a well known case-based planning system, Darmok, to overcome some of its most important aws. Darmok, initially designed to play real-time strategy games, does have some problems concerning its reactivity capabilities. In particular, it can be either too reactive when executing some plans, or too non-reactive when executing some low level actions, which makes its performance greately deteriorate in some scenarios. By using expert knowledge in the form of behaviour trees, we intend to overcome these problems. |
En línea: | https://eprints.ucm.es/id/eprint/11433/1/Memoria.pdf |
Ejemplares
Estado |
---|
ningún ejemplar |