En el ajedrez simplificado buscamos sacar el máximo provecho de una dada situación en presencia de incertidumbre. El máximo provecho es volcar el juego a nuestro favor con la juqada que elijamos. La dada situación son las req1as del ajedrez y la posición de las cuales partimos. La incertiduabre se refiere a nuestra ignorancia acerca de cómo nos va a replicar el adversario, lo cual éste tampoco sabe porque no lo pensé todavía. Sería bajo certidumbre si el oponente juega lo mejor posible, porque en ese caso yo (con ayuda computacional) sabría lo que va a jugar. El problema del mejor movimiento de las negras, que aparece en el artículo de Waltz referido al ajedrez siaplificado, en tablero de 4x4 en lugar de 8x8, con la posicion inicial que se resume así:
1000 | x | -1000 | x |
x | x | x | 3 |
1 | x | x | x |
x | x | x | -5 |
Notas: * El tablero de 4x4 es el del ajedrez simplificado * Las cifras de esta lista son los puntajes al hacer el inventario 1000 significa rey negro (nuestro) -1000 significa rey blanco 3 significa caballo negro 1 peón negro a punto de ser coronado -5 torre blanca 10 dama negra x casillero vacío de tablero 4x4 PUNTAJE -2,5 (posición perderdora) SENTIDO DE AVANCE Negras hacia abajo,Se puede analizar en forma tipificada mediante una matriz decisional donde las cinco acciones que pueden encarar las fichas negras (nosotros) aparecen como columnas al a a5, donde la letra a simboliza la palabra acción, las filas son por lo menos dos. La primera corresponde a la solución trivial en que las blancas (el opositor) juegan lo peor posible (nivel de juego pésimo) y la segunda a la solución singular en que las blancas juegan lo mejor posible (nivel de juego óptimo), jugadas medidas a través del sistema de puntaje (la función de evaluación) explicado en el artículo, después de la respuesta de las blancas a nuestra jugada. En casos prácticos las blancas pueden jugar con un nivel intermedio entre el peor y el mejor, lo cual se aplica a otras filas (a otros niveles de juego diferentes de los dos anteriores) que aquí no analizamos.
MATRIZ DECISIONAL DESPUES DE LA RESPUESTA DE BLANCAS A NUESTRA JUGADA al...a5
suce- sores |
a1- caballo negro al centro | a2- caballo negro abajo | a3- caballo negro arriba | a4- rey negro abajo | a5- peón coronado | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hº blancas juegan pésimo |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
puntaje |
1000-1000+1+3-5 -1,5+2,5= 0 |
1000-1000-5+1+3= -1 |
1000+3-1000+1-5= -1 |
-1000+1000+3+1-5 -1.5= -2,5 |
1000-1000-5 +10= 5 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
H1 blancas juegan óptimo |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
puntaje |
1000-1000+1+3-5 -1,5+2,5= 0 |
1000-1000+1-5= -4 |
1000-1000+3+1-5 -0,5 = -1,5 |
1000-1000+1-5 -10= -14 |
1000-1000+3-5-10-1,5= -13,5 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hº -
Máximo de puntaje |
no | no | no | no |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
H1 - Máximo de puntaje |
|
no | no | no | no |
Maximin se denomina buscar cuál acción está asociada con el máximo de los mínimos por columna (columnas son acciones o decisiones). En la primera columna debemos seleccionar el mínimo, que corresponde a la fila del oponente jugando bien (filas son estados de la natura). Esto mismo se repite en cada una de las restantes cuatro columnas, con el mismo significado. Tenemos entonces cinco valores, de los cuales buscamos no solamente el valor máximo, sino tambien queremos identificar en qué columna está.
Repetimos que esto es para bonificaciones desde nuestro punto de vista (las negras). En los textos habitualmente no se anotan las bonificaciones sino las penalidades. Cuando se hace esto último, corresponde decir que el pesimismo se asocia con la estrategia minimax.
3. CRITERIO PARA MEDIR UN DADO ESTADO EN EL TABLERO DE AJEDREZ.
Waltz nos explica que hay tres criterios que, combinados, ayudan a saber quien va ganando.
1. Un inventario o suma algebraica de las fichas del tablero y de la suma algebraica de las amenazas que están sufriendo cada una de las fichas, en respuesta a la pregunta individual: ¿estás amenazado? La suma algebraica de sumandos con signo positivo se usa para lo que nos ayuda y negativo para lo que nos frena,
2. Una evaluación de quién tiene el dominio del centro del tablero.
3. Una consideración de la factibilidad que un peón pueda llegar a coronarse.
4. COMENTARIOS SOBRE LA DECISION OPTIMA CON LOS ESTADOS RESULTANTES CUANDO LAS BLANCAS HAN REPLICADO NUESTRA JUGADA, LA INDICADA CON al, a2, a3, a4 o a5.
Como se ha visto, el puntaje corresponde a bonificaciones para las negras.
Seleccionamos los mínimos de cada columna, lo cual está asociado con nuestra actitud pesimista con respecto a cómo ha de jugar el oponente, que buscará que nuestras bonificaciones sean mínimas. la tarea se explica en la antúltima fila o estado de la natura de la matriz decisional.
Como resultado de esa tarea, tenemos cinco valores máximos, que volvemos a anotar en la última fila de la matriz. Con ellos debemos elegir nuestra nuestra jugada más racional, habida cuenta de nuestro pesimismo. Si fuesemos optimistas, la racionalidad nos lleva a a4 o a5. Nos damos cuenta que, contrastando entre sí las distintas escuelas, una la pesimista o Maximín para bonificaciones y otra la optimista o Maximax para bonificaciones, llevan a soluciones distintas. Esta falta de coherencia preocupa a muchos teóricos, que piden entonces que uno se esfuerce por cuantificar sus incertidumbres. Se dice que siempre sabemos algo, tenemos alguna pista, de cómo es la aparente incertidumbre que enfrentamos. Si cuantificamos aunque sea borrosamente esa incertidumbre, el problema pasa a ser de toma de decisiones bajo riesgo, soluble matematicamente, lo cual conforma a los teóricos. Se ha sugerido que el optimista es quien conoce más de la situación que lo que normalmente saben los demás, por lo cual cuando piensa que la suerte va a estar de su lado, lo hace basado en antecedentes que no pone sobre la mesa.
Desde cierto punto de vista, nuestro conocimiento durante la partida de ajedrez es conocímiento borroso, "fuzzy knowledge'. No vemos claro qué hacer, sino a medias. No sabemos exactamente cómo jugarán las blancas despues de la jugada nuestra que estamos ponderando.
La defensa habitual del pesimismo es bastante intuitíva, Si suponemos que el opositor juega bien, estamos preparando nuestra jugada de tal forma, que si juega bien ya lo habíamos previsto de antemano y si juega mal, alguna ventaja adicional vamos a poder sacarle a su falta de pericia.
En cualquier caso, una mayor seguridad en el análisis deriva de tener más información valiosa, que en este caso es fácil de interpretar. Habrá que avanzar a un nivel más abajo, o sea calcular la contrarréplica nuestra a cada réplica opositora. Esto se vuelve en un árbol tan ramificado que en general no alcanza el tiempo si se sigue con la misma actitud, bajando más y más de nivel. Una partida de ajedrez tiene en promedio 52 niveles, como anota Waltz. Debemos conformarnos con un descenso de nivel lo suficientecente bueno para los fines prácticos (principio de racionalidad restringida de Herbert Simon).
Nótese que aunque nosotros (las negras) no hemos ganado aún, hemos salido de una posición perdedora con puntaje -2,55, para remontar a una posición cuyo puntaje es 0, segun el método aquí explicado.
Obsérvese que el programa consiste en un cierto manejo de listas y que la asignación de puntajes es de la forma de un polinomio lineal.
A la asignación de puntajes ('para sacar el máximo provecho') la llamamos función de evaluación del criterio o de la función objetivo,
S. El JUEGO DEL AJEDREZ COMO VECTORES Y MATRICES.
Como en otros ejemplos, una secuencia de jugadas se puede descomponer en un estado inicial registrado en un vector fila, que premultiplica a un operador que es una matriz cuadrada, dando como resultado de nuevo un vector fila que simboliza al sucesor del estado inicial. Interesa pensar si no se puede hacer algo análogo con el ajedrez. Efectivamente, con un vector fila de 16 elementos se puede simbolizar el estado inicial, o sea, para el caso analizado,
que seguido del operador rey blanco abajo, genera el vector resultado óptimo para las negras y las blancas (maximin)
9. DOS COMPUTADORAS COMPITIENDO PARA AFINAR El CALCULO DE PUNTAJE.
La aparente arbitrariedad de evaluar con 10 a un rey jaqueado o con un 3 a la presencia de un caballo, puede refinarse con un método bastante intuitivo, Basta poner a competir miles de veces a dos computadoras, programadas de manera que los parámetros o cifras de cada una de las máquinas difieran de las de la otra. La que gane más veces estará más cerca de la verdad. Así, los parámetros se ponen experimentalmente a prueba, quizás a través de un programa maestro de diseño de experimentos del cual son esclavas esas dos computadoras. Por supuesto, esta tarea no necesita de dos computadoras, ya que una sola, ingeniosamente programada, puede satisfacer muy bien la misma función.