Barral y von der Becke - Biotermodinámica del Cerebro
150.
IMPASSE DE NEWELL
Sea un ejemplo sencillo de aplicación del proyecto Soar de Newell. Sea un robot que estando sediento y hambriento, tiene como meta dejar de estar hambriento. Puede operar de pocas maneras, COMER, BEBER y ABSTENERSE. La memoria de largo alcance consiste en reglas de producción preexistentes. Si se aplica la técnica matricial, el vector fila o estado inicial será
Despues del IF están las condiciones y despues del THEN (-->) las acciones. Entonces la dinámica es, como en la Fig 16,
En ella hay elementos E que han de generar acciones A. Las reglas que se descargan tienen el efecto de aportar elementos E adicionales. Todas las producciones cuyas condiciones son satisfactorias descargan en paralelo. La actividad de las reglas de producción se interpreta como búsqueda en el espacio de problema. Cuando se acaban las reglas, termina el proceso logrando la meta o nó.
Nótese que es muy importante saber en qué espacio de problema se está, ya que segun cual sea, serán los posibles métodos de resolución de problemas (Fig 15).
Inicialmente Soar necesita imperiosamente tener cargadas producciones en su memoria de largo alcance, so pena de incurrir en una infinita secuencia de impasses. Para el arranque se carga un archivo (default.soar) con un centenar de producciones que proveen respuestas por defecto, para todos los tipos de impasses existentes.
Las impasses son los únicos casos de indecisión en Soar. Generan una submeta que busca, bajo la forma
su propia resolución en un nuevo espacio de problema, lo mismo que cualquier otra meta. La hilera de metas es única e indica las preferencias. Esa hilera no puede crecer sino por nuevas impasses. La satisfacción de una submeta, la búsqueda, usa exactamente el mismo ciclo de decisión que se emplea rutinariamente.
El troceado (p 50) - en inglés chunking - es el único mecanismo de
151.
aprendizaje. Su objetivo es el de ahorrar la ocurrencia de impasses. Cada vez que una impasse se resuelve, aparece un nuevo trozo "o" de la ecuación
Un trozo es una regla de producción que ha de generar objetos preferenciales de un tipo tal, que de haber existido durante la pre-impasse, la hubieran evitado. ¿Por qué preferencias? La estrategia de Soar es primero acumular operadores aplicables y luego poner en claro sus preferencias y por último ya sea elegir al ganador o ya sea abrir, en su defecto, un nuevo espacio de problema para elegirlo. La búsqueda de preferencias se halla en medio del más importante ciclo decisional de Soar. Nótese muy especialmente que cada ciclo decisional es una etapa elemental de una búsqueda combinatoria, de una "deliberación".
Un trozo es entonces un cortocircuito para el largo razonamiento que surge para satisfacer la submeta creada para resolver la impasse. Si las condiciones de futuras producciones son iguales, la impasse deja de presentarse. Si difieren en detalles, la tarea se debe reiniciar. La falla en poseer el conocimiento de procedimientos necesario para el espacio de problema arrastra consigo una típica impasse: la submeta será adquirir el conocimiento relevante.
La resolución de la impasse se interpreta como preferencias anotadas a la derecha de
Como conclusión surge con fuerte evidencia el aporte de la preparación y de la deliberación al conocimiento, así como la trascendencia de la memoria y del aprendizaje en la racionalidad. En Soar no están subdivididos en bloques, sino integrados en un sistema. El proyecto más interesante sería aportarle tambien creatividad e inteligencia emocional.