.
Ubicación del problema
Lev Vygotsky, el famoso psicólogo ruso, pone énfasis en que una herramienta inventada por el hombre significa un avance cognitivo a disposición de sucesivas generaciones, que no necesitan del tedio de "reinventar la rueda". Philip Agre y Ian Horswill han experimentado esto mismo con artefactos culturales que simplifican el estudio de las interacciones entre el robot y el ambiente provisto de dichos artefactos. Virtualmente, al usar utensilios, el robot extiende su cuerpo y con ello simplifica el ambiente en que está operando. (El artefacto que se está usando se puede argumentar que es validamente parte del cuerpo del robot). Por supuesto, no es necesario saberlo todo del artefacto usado ni de los razonamientos que permitieron su creación. Los diseños subóptimos ya se han descartado y no vuelven a incidir en el estado del arte. La vida diaria incluye en buena medida el uso de esos artefactos sobre los cuales Vygotsky ha argumentado con perspicacia.
La experiencia sobre la cual se informa aquí pone de manifiesto la prudencia de todos estos argumentos. Se parte de un así llamado programa de agente "Toast" (esto es, tostada) para un robot del mismo nombre, preparador de desayunos en un restorán de procesamiento rápido. Le toca preparar no solamente tostadas sino un menú diversificado de ingredientes para el desayuno, en forma continua, manipulando diversas acciones con la ayuda de utensilios de cocina, en suficiente disponibilidad. No apela a ningun plan simbólico de la realidad, no realiza búsqueda alguna, ni razona sobre el futuro. Esto lo logra dado que los utensilios tienden a reducir la complejidad de las decisiones que de otra manera afectarían al programa de agente. La principal estrategia del robot pareciera ser la de obedecer la regla (truquesa) de
"encontrar algo que sea necesario hacer y decidirse a hacerlo".Esto se puede probar que converge a satisfacer metas muy características y aptas. La estructura del ambiente en una cocina y en otros lados tiene patrones que simplifican mucho las cosas a considerar en el acto de diseñar un "programa de agente".
Modelo de acciones a encarar
La bibliografía previa ya ha adoptado un cierto punto de vista sobre planificar tareas y entonces actuar. A veces se introducen probabilidades o trabajos multirrobot, pero lo habitual es esgrimir un conjunto, genérico y por defecto, de reglas aptas para cualquier nuevo proyecto. Ese modelo parte de la idea de "acciones" y "situaciones" como entidades discretas a la manera de una película de celuloide, donde un marquito rectangular es una situación y el marquito siguiente, discreto, difiere con motivo de una acción que permitió la transición entre un marco y el consecutivo, entre una situación (o estado) y otra. Los efectos de una acción indican la transición de un marco muy claro a otro también muy claro y bien definido.
Nuevo punto de vista
Esto conduce a la posibilidad de imaginar un espacio de problema que se puede representar como rutas a recorrer. Los vértices son los marquitos (situaciones) y los arcos son el espacio entre marco y marco (acciones). La investigación clásica de la planificación es sobre todo el estudio de la estructura de este espacio. Los temas de estudio de dicha estructura son el repertorio de las posibles acciones del agente, el esquema que se emplea para "representar" las diversas acciones y para imaginar las posibles situaciones del ambiente y tambien la estructura del mundo. Si el agente obedece a un plan, habrá en el espacio un punto de partida y una meta, unidas por etapas de vértices y arcos. El punto de partida tendrá que estar de acuerdo con el conocimiento que tenga el agente sobre dicho punto de partida. El plan será más o menos fácil de armar segun como resulte ser la estructura del espacio de problema, que deberá ser investigado por búsquedas.
La investigación del espacio es - sin embargo - conceptualmente independiente de la ideas ya sea de planificar, ya sea de considerar las acciones como la forma de ejecutar el plan.
El nuevo punto de vista de Agre y Horswill es el de la escuela dinámica de la cognición (Ashby, van Gelder, Beer, Giunti). Intentan mostrar que los ambientes en que se maneja un robot permiten que éste improvise a través de decisiones simples obviando la necesidad de una planificación formal. Hayes - Roth ha encontrado que existen ambientes más o menos complejos donde la improvisación momento a momento ofrece ventajas desde el punto de vista de su adaptación a las circunstancias que evolucionan. Esas decisiones son "on-line" entre las percepciones y las acciones. Hay tambien circunstancias carentes de prisa y urgencia, en que no es despreciable sino conveniente decidir "off-line", dandole tiempo al proceso que puede ocurrir entre la percepción sensorial y la acción motriz. Entre ambas aparece la gestión de símbolos y el razonamiento simbólico sobre el futuro, así como las representaciones de la acción para memorizar y guiar acciones futuras (experiencia, que no está negada al operar "on-line"). Pero Agre prefiere sugerir que estas formas más complejas de razonamiento con respecto a decisiones para actuar, pueden ser delimitadas y controladas de manera sustancial por estructuras del ambiente que ayudan a la selección momento a momento de cuál decisión "truquesa" tomar.
Análisis del dominio culinario
Volvamos a nuestro muy interesante dominio culinario del robot Tostada. Si bien es una rutina, es bastante complicada, no carece de sorpresas ni de incertidumbre y se presta para ensayar los métodos formales de la planificación clásica. La intención de usar esos métodos formales no es el de convalidar sus suposiciones implícitas sino de mostrar que se puede superarlas más allá de lo que afirman. Agre lo logra descubriendo que las estructuras del espacio de este dominio revela que es innecesaria la invención de formalidades.
A este respecto hay dos niveles, la visión de planta baja donde opera "Tostada" y la visión "aérea" donde opera el diseñador. En la planta baja la tarea es rutinaria, en la planta aérea el trabajo es fuerte. Allí hay que descubrir aquellas regularidades del ambiente por las cuales la tarea de "Tostada" en planta baja sea el resultado de políticas relativamente simples. En general la tarea de descubrimiento de regularidades en la planta aérea facilita la operación en la planta baja. En la planta baja se descubren las restricciones adecuadas para un diseño más simple de un agente, así como mejores pistas visuales y una suficiente independencia entre las variables que resultan pautas útiles para el diseño en la planta aérea. Si esas regularidades luego resultan ser falsas o inestables, la tarea en planta baja se complica. Horswill pretende armar una forma de diseño a encarar mediante deliberación y atención. Para ello hay que enfatizar el estudio que se aplica a los ambientes y al sitio que ocupa el agente en el ambiente, esto es, en las interacciones y no en la arquitectura
Hagamos una representación orientada a objetos de la acción en el ambiente culinario. Los objetos en cuestión son objetos de uso (ollas y sartenes, herramientas y utensilios) y objetos de ingesta (alimentos y bebidas) y de limpieza. "Tostada" los moverá, los mezclará, los transformará, los limpiará y así siguiendo. El estado del mundo se puede descomponer en el estado de los objetos mencionados y un bajo número de relaciones entre objetos. Los estados de un huevo pueden ser que venga "cascado de antemano" (a descartar), que esté "intacto", que esté "cascado", que esté "batido" y que esté "cocido". Una olla puede estar "ocupada", "vacía y sucia" y "vacía y limpia".
Hay propiedades adicionales de estos objetos que aquí se ignoran. Se sabe que en la planificiación clásica una acción debe tener un conjunto de precondiciones y un conjunto de efectos. Ahora, en este nuevo punto de vista, hay que ingeniarse en volcar las precondiciones y los efectos en términos de propiedades y de relaciones de los objetos. Por ejemplo, la acción de limpiar una cuchara no tiene ahora precondición alguna, porque no es un sinsentido limpiar una cuchara cualquiera sea su estado. El resultado de la acción es llevar la cuchara a la meta de estar limpia. La acción de batir un huevo en un bol usando un tenedor tiene como precondiciones las siguientes:
Con esto se ve que el formalismo se preocupa del estado de los objetos. El estado del mundo, momento a momento, coincide en buena proporción con el estado de los objetos. No es imposible armar clasicamente una estructura gráfica que contenga todos los posibles estados del mundo, incluyendo todas las acciones posibles entre estado del mundo y estado del mundo. Si el ambiente culinario tiene muchos objetos, el gráfico resultaría enorme.
A pesar de ser enorme, en ese gráfico hay oculta mucha estructura. Esto se demuestra con otro gráfico orientado a objetos. Olvidemos por ahora las relaciones entre objetos. Miremos cada objeto como teniendo su gráfico de estados propio. Los huevos tienen un gráfico que incluye "cascado de antemano", "intacto", "cascado", "batido" y "cocido". Los tenedores tienen otro gráfico con estructura que incluye "sucio" y "limpio" como estados posibles. Se puede imaginar ahora el producto cruzado de los estados de cada objeto en particular. De este supramundo, el mundo adopta momento a momento el aspecto de un subconjunto del mismo, denominado cartas de estado de Harel. Incluye solamente acciones que se pueden realizar. Si no hay tenedores, no habrá huevos batidos. Con este formalismo las cosas no son de por sí menos complicadas. Si un tipo de gráfico no sirve para encontrar soluciones óptimas, tampoco el otro. Pero proporciona un lenguaje para cualquier nueva estructura que se descubra al analizar los hechos. Con nuevas estructuras descubiertas, la modelización del dominio culinario de "Tostada" hace que el cómputo pase de difícil a más simple.
Intentemos descubrir nuevas estructuras. Una puede ser para "objetos de manipulación culinaria" (espátulas, tenedores) con su estado normal "limpio, seco, listo para el uso" y otra para "objetos edibles y bebibles" (huevos, jarras de agua, cuadrados de manteca) con su estado normal "no ingerible, crudo".
Formalismo
Intentemos un formalismo simple para objetos y acciones. Objeto será ahora la voz abreviada para señalar "tipos de objetos". Cada tipo de objeto tendrá un gráfico de estado asociado con vértices que son "estados" y arcos que son "operaciones". Las operaciones no son etiquetas del arco, son el arco mismo. Cada operación es única y no está compartida con otros tipos de objetos. El dominio tiene diferentes "tipos de acciones" con un conjunto de acciones cada uno de esos tipos. Una operación será la transición de huevo "cascado" a huevo "batido" y otra operación la transición de tenedor "limpio" a "sucio".
En esta tarea simplificatoria hay casos límites que reciben nomenclaturas distintivas. Así, una acción será "enfocada" si se trata de una única operación o sea que involucra a un único objeto. El caso recién mencionado no es enfocado.
Igualmente, un estado será "libre" si se puede acceder a dicho estado desde cualquier otro estado mediante operaciones enfocadas.
Un "objeto para manipulación culinaria" es un objeto con no menos de un estado libre en su carta de estado de Harel. Cada "objeto de manipulación culinaria", como ya se ha explicado, tendrá un estado libre "normal", esto es, "limpio".
Un "objeto edible o bebible" obedece a este concepto básico: el cocinero usa "objetos para manipulación culinaria" para manipular "objetos edibles y bebibles". Una acción con uno o más objetos para manipulación culinaria, puede ser una acción normal ssi se ha empleado uno o más utensilios inicialmente limpios.
Un objeto edible o bebible es un objeto que tiene un gráfico de estado acíclico que incluye un estado "normal" que es su estado crudo y sin procesar. A partir de ese estado normal se puede llegar a cualquier otro estado del gráfico solamente por acciones normales con objetos para manipulación culinaria limpios. Un objeto edible o bebible puede estar manipulado con otras operaciones adicionales a las acciones normales explicadas.
Una tarea culinaria tiene estas cuatro propiedades:
Política decisional aplicada
Expresado verbalmente, la solución al problema de "Tostada" aplica una política simple en forma iterativa.
Es fácil reconocer por qué esta lista es una política simple y operativa. Cada acción ayuda ya sea a mover el objeto edible o bebible hacia su estado meta o ya sea a mover el objeto para manipular hacia su estado normal. Cuando todos los utensilios están en su estado normal (o algo antes), es posible mover el objeto edible o bebible hacia su estado meta. Dado que los gráficos para los estados de los objetos edibles o bebibles son finitos, es posible hacer el cálculo de las transiciones de estado faltantes para llegar a la meta. Por analogía, tambien es finito para los utensilios el número de etapas para llegar a su estado normal y también se puede calcular un valor dintel de las etapas precisas para retomar y hacer posible el proceso hacia la meta. Dado que cualquier acción arbitraria reduce uno de esos dos valores dintel, o sea que dado que la distancia total de los objetos edibles o bebibles en dirección a su meta siempre se acorta cuando todos los utensilios están en su estado normal, se deduce que eventualmente los objetos edibles o bebibles han de llegar a su estado meta.
Desventajas y objeciones
Es obvio que el argumento anterior descansa sobre una serie de suposiciones simplificatorias. Por ejemplo,
Otras simplificaciones similares darán origen a parches similares, combinando juiciosamente limitadas apelaciones a la estructura del ambiente y limitadas extensiones a la arquitectura. Agre propone estas limitaciones como un ejemplo tipico de ideas simplificatorias que surgen en ambientes no tan simples.
Discusión final
Conclusion
Se augura aquí una tendencia de estudio meticuloso de los ambientes (en este caso el ambiente culinario) donde está gestionando un agente (en este caso "Tostada") con el objetivo de entender mejor, con dicho estudio, la interrelación agente-ambiente. Ese estudio actuará como un factor más por el cual la Inteligencia artificial deje de ser una disciplina auto-contenida y pase a ser una llave de contactos múltiples, en este caso interdisciplinarios. Con esa llave se podrán construir caracterizaciones que dejarán de ser tan formales y planificadas como se piensa ahora. En cambio, resultarán más bien producto de la "improvisación" por parte del agente en su interacción con el ambiente.
"Tostada" en un ambiente culinario es un interesante ejemplo de considerar agentes y ambientes como subsistemas participantes de lo que propone la concepción dinámica de la cognición, un sistema cognitivo dinámico integrado donde entre la percepción del agente y su acción no hay demasiados aportes inútiles de la zona intermedia entre percepción y acción. Este bajo aporte del razonamiento, de la "representación del ambiente", de la memoria o de la "experiencia" ha de tener, seguramente, una contrapartida. La adquisición de "experiencia", resultante de la autorreflexión sobre lo que está haciendo el robot en su actividad diaria con sus percepciones de ella y acciones consiguientes, no ha de ofrecer mayores problemas en el futuro de la Inteligencia artifical, con memorias artificiales de precio casi nulo. De todos modos mucho se puede conseguir por la técnica del estudio dinámico de la interacción agente-ambiente.
5.may.2001