Proyecto 1: 8-puzzle; Evaluacion experimental de Algoritmos de Busqueda Busqueda en Amplitud, Busqueda en Profundidad, Iterative Deepening A*, LRTA* ------ Proyecto 2: Animats: Modelacion y Control utilizando MDP's Se trata de controlar un `animat' en un grid NxN habitado por M depredadores. Varios casos a considerar, algunos a modelarse como Discounted MDP; otros como Shortest Path o Goal MDP's Caso 1: - el animat evita a los depredadores (Juego de la ERE) - no ruido - full observabilidad - politica depredadores estacionaria (la misma para todo tiempo, no hay `hambre', etc etc) Acciones Depredadores: acelerar en direccion del Animat; aceleracion x e y; positive y negativa; seteada automaticamente a partir de posicion de Animat Accion Animat: idem; a ser seleccionada por politica de control Estado: posicion Animat y Depredadores; Velocidades. Velocidades discretas, ej, -3, -2, -1 , 0, 1, 2, 3 Acciones son Deltax y Delta x de aceleracion. Ejemplo: para depredadores Deltax,Deltay en [-1,0,1]; (cada delta indica cambio de velocidad en x o y) Ventaja para el agente: es que Deltax, Deltay puede estar por ejemplo [-2,-1,0,1,2] Cuando velocidad n en direccion x/y, avanza n casillas en x/y Modelar como Discounted MDP; gamma=0.99 Opcion 1: cada t sin ser capturado, reward 1 cada t capturado, reward -30 y recomenzar Opcion 2: cada t capturado costo 30 y recomenzar Variaciones 1: ruido en movimientos depredador/animat topes velocidades, aceleraciones, Delta's, etc. observabilidad parcial para depredadores; obstaculos Variaciones 2: Resolver instancias particulares con RTDP, Animat tiene que llegar a Goal evitando predadores en ciertas posiciones iniciales, costo acciones=1; costo ser comido=30 Comparar con Value Iteration ** Es necesario construir programa para poder visualizar comportamiento en Grid ** Para value iteration espacio de estados no deberia exceder 10^7. Eso implica grid de 10x10 +-, y probablemente no mas de dos depredadores (ya eso es > 10^6) ** Para RTDP: con estado inicial y goal fijos, estas restricciones no son estrictamente necesarias. Probar con varias ** Cualquier variacion sobre estos experimentos que de comportamientos interesantes - inteligentes (aja! effect). -----