Medio ambiente
Nuestro medio ambiente será como un tipo calabozo con forma de laberinto (el cuál será dinámico), constará de una entrada y una salida Y tres tipos de agentes principales: buscador, guardián y espía. El agente buscador se encargará de buscar un objeto y huir hacia la salida, evitando lo más que pueda al agente guardián. El agente guardián se encargará de hacer rondas en el calabozo en diferentes zonas (mientras las va conociendo y aprendiendo) y en cuanto encuentre al agente buscador, seguirlo para capturarlo. El agente espía se encargará de ayudar al agente buscador para encontrar el objeto verdadero, indicándole dónde hay atajos e interfiriendo en las comunicaciones de los agentes guardianes (solo en el caso que exista más de un agente guardián). Puede que existan más buscadores y de ésta forma los agentes guardianes se confundirán.
En caso de que solo existiera una entrada, se tendría que conseguir el objeto único que podrá convertir la entrada en la salida, para esto, nuestro agente tendría que recordar el camino por el que vino, siempre tratando de evitar al agente guardia.
Existirán agentes guardias, los cuales estarán recorriendo todo el calabozo para conocer el terreno y estar haciendo guardia en algunas de las zonas del mismo. Dentro del calabozo existen diversos objetos, de los cuales hay uno que es el que le abrirá la puerta a la salida, pero hay objetos falsos, copias, que tratarán de confundir al agente buscador.
Plataforma y lenguaje de programación
El ambiente se desarrollará sobre Dev C++, utilización C++ con el API grafico de GLUT que usa OpenGL pera su operación
Actividades que puede aprender el agente
Identificar objeto. La actividad de identificar objeto será llevada a cabo por el agente buscador. Consistirá en recorrer el calabozo y buscar objetos, aplicando el reconocimiento de patrones, para diferenciar los objetos entre sí y las copias falsas del original. Lo que es necesario para elegir el verdadero objeto y continuar con su camino hacia la salida. Como se mencionaba en la descripción del medio ambiente, se puede llegar a contar con solo una salida y una entrada, por lo que deberá recordar el camino que siguió(o si aprendió un camino mejor) para llegar a la salida. Si llegase a identificar un objeto falso como verdadero los agentes guardianes irían inmediatamente por él y el agente buscador perdería. Sin embargo si logra alcanzar el objeto verdadero, los agentes guardianes empezarían la persecución.
Conocer calabozo. Ésta actividad puede ser realizada por los 3 agentes que se encontrarían en el medio ambiente (buscador, guardián y espía). Consiste simplemente en ir reconociendo el calabozo y guardar dicha información. El agente buscador usará esta información para conocer donde se encuentra la salida y dirigirse a ella una vez que encuentre el objeto verdadero y a su vez saber donde se encuentran algunos atajos (aprendidos gracias al agente espía). El agente guardia deberá conocer el terreno para que cuando el agente buscador encuentre y agarre el objeto verdadero o agarre un objeto falso algún comience a perseguirlo. Finalmente el agente espía se encargará de buscar o encontrar atajos para ayudar al agente buscador en la tarea de encontrar el objeto verdadero y evadir al agente guardia cuando sea necesario.
Si el agente buscador encuentra y agarra un objeto falso, (si hay más de un agente guardián) se comunicarán entre ellos para rodear al agente buscador, sin embargo el agente espía hará su aparición y se interpondrá en dicha negociación para dar datos falsos y darle tiempo al agente buscador de buscar un lugar seguro.
Blog para documentar el trabajo de programación realizado en la clase de Aprendizaje Automático del Tec de Monterrey, Campus Estado de México. Enero-Mayo 2010.
Tuesday, January 26, 2010
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.