Dilema Del Prisionero (Extrato del libro homónimo de William Poundstone)
-
Upload
angelantoniocaminero -
Category
Documents
-
view
1.984 -
download
31
Transcript of Dilema Del Prisionero (Extrato del libro homónimo de William Poundstone)
William Poundstone
El dilema del prisionero John von Neumann, la teoría de juegos y la bomba
El libro de bolsillo Matemáticas Alianza Editorial
TrTULO ORIGINAL: Prisioner'sDilemma. John von Neumann, Game Theory atld the Puzzle ofthe Bomb
TRADUCTOR: Daniel Manzanares Fourcade
Primera edición en «El libro de bolsillo»: 1995 Primera edición en «Área de conocimiento: Ciencia ytécnjca~~: 2005
Diseño de cubierta: Alianza Editorial Ilustración: Ángel Uriarte
Reservados todos los derechos. El conlenido de esta obra está protegido por la Ley. que establece penas de prisión y/o multas, además de las correspondientes indemnizaciones por daños y perjuicios, para quienes reprodujeren, plagiaren. distribuyeren o comunicaren públicamente, en todo o en parte, una obra literaria, artística o científica. Osu transformación, interpretación o ejecución artística fijada en cualquier tipo de soporte o comunicada a través de cualquier medio. sin la preceptiva aUlorizaciÓn.
© 1992 by WiJliam Poundstone © Ed. cast.: Alianza Editorial, S. A., Madrid, 1995, 2005
Juan Ignacio Luca de Tena, 15; 28027 Madrid Teléfono 91 393 88 88 w\\7W.alianzaeditorial.es ISBN: 84-206-5840-5
Depósito legal: M. 50.199·2004 Fotocomposición e impresión: Fernández Ciudad, S. L. Catalina Suárez, 19.28007 Madrid Printed in Spain
3. Teoría de juegos
La noción de un juego que reflejara los conflictos del mundo es antigua. En el Mabinogion, una colección de cuentos populares galeses (siglos Xl-XlII), hay un relato en el que dos reyes que están en guerra juegan al ajedrez, mientras sus ejércitos batJlan en las proximidades. Cada vez que un rey se come una pieza, llega un mensajero para informar al otro que ha perdido un hombre importante o una división. Al final, un rey da jaque al otro. Un mensajero ensangrentado entra tambaleándose y dice al perdedor: «El ejército huye. Habéis perdido vuestro reino)},
Esta historia indica claramente el origen militar del ajedrez. Hay otros juegos que simulan batallas, por ejemplo el juego chino GO, el hindú Chaturanga, y muchos otros. Aquellos que ven los juegos como un símil de la guerra pueden ver también la guerra como una especie de juego. El modelo típico de este caso fue la afición obsesiva por jugar a Kriegspiel que durante un siglo atrapó a Prusia.
60
61 3. TWRfADEJUEGOS
Kriegspiel
Se ideó como un juego educativo para las academias militares en el siglo XVIII. En un principio, se jugaba sobre un tablero consistente en un mapa de la frontera francobelga. dividido en una cuadrícula de 3.600 casillas. Las piezas avanzaban o retrocedían como si fueran ejércitos.
El Kriegspiel original dio lugar a muchas imitaciones y fue suplantado por una versión que se popularizó entre los oficiales del ejército prusiano. Se utilizaban mapas militares verdaderos, en lugar de un tablero. En 1824, el general en jefe de los mandos de Prusia dijo a propósito del Kriegspiel: «No es en absoluto un juego. ¡se trata de una educación para la guerra!)).
Así comenzó una obsesión nacional que aún hoyes difícil de creer. El alto mando prusiano se encandiló tanto con el juego que envió ejemplares del mismo a todos los regimientos del ejército. Las órdenes reinantes obligaban a cada militar a jugarlo. El Kaiser en persona aparecía en los torneos de Kriegspiel con uniforme militar completo. Los artesanos tallaron las piezas de Kriegspiei con los detalles más nimios, inspirándose en la moda reinante de los juegos de ajedrez. claramente militarista (las piezas simulaban mariscales alemanes, coroneles. soldados rasos, etc.). Un pálido reflejo de lo que fueron estos Zinnfiguren (<<figuras de estañO))) sobrevive hoy, son los soldaditos de juguete. El juego acumuló complejidades cada vez mayores, al exigir los fanáticos jugadores un mayor «realismO)). El libro de instrucciones, que en principio tenía 60 páginas, engrosaba con cada nueva edición. Ciertas contingencias del juego, que antes se decidían por azar, se determinaban usando tablas de datos obtenidos de guerras reales.
A partir de ciertas afirmaciones de que las victorias militares prusianas se debían al juego, aumentó el interés en todo el mundo. En Prusia. los ensayos mediante Kriegspiel
62 EL DILEMA DELPRlSIONERO
de la guerra con Austria dio lugar a una estrategia que decidió la victoria de la Guerra de las Seis Semanas en 1866. Posteriormente, el ejército austríaco decidió no correr más riesgos, y empezó a jugar a Kriegspiel. Otra supuesta victoria prusiana gracias al Kriegspiel. la derrota francesa en la guerra franco-prusiana en 1870, hizo surgir en Francia el entusiasmo por Kriegspiel.
Kriegspie!llegó a los Estados Unidos tras la, guerra civil americana. Se quejaba un oficial del ejército americano de que el juego <<no se puede practicar con facilidad e inteligencia salvo que uno sea matemático, y se necesita para usarlo adecuadamente un esfuerzo de formación, estudio ypráctica equivalente al aprendizaje de una lengua extranjera a nivel de conversación», De todos modos. llegó a popuJarizarse en la Marina y en el Naval War College en Newport, Rhode [sland.
Se considera que la última victoria atribuible a Kriegspiel fue la victoria de Japón en la guerra ruso-japonesa, en 1905. Se hizo patente que las estrategias precisadas mediante el juego no siempre funcionaban en la batalla. La derrota de Alemania en la Primera Guerra Mundial fue e! golpe de gracia para el juego, salvo, irónicamente, en la propia Alemania, donde los comandantes de posguerra jugaron unos contra otros con copias de hojalata de los regimientos que e! Tratado de Versalles les había negado.
En Budapest, e! joven John von Neumann jugó un improvisado Kriegspie1 con sus hermanos. Dibujaron castiÍios, autopistas y costas en pape! cuadriculado; después avanzaban o retrocedían los «ejércitos» de acuerdo con las reglas. Durante la Primera Guerra Mundial, Johnny obtuvo mapas de los frentes de lucha y siguió en e! juego los informes de los verdaderos avances y retiradas. Actualmente se juega Kriegspie! mediante tres tableros de ajedrez, que sólo son visibles a la vez por un árbitro. Esta modalidad fue popular como una diversión después de la comida en la organización RAND; Van Neumann jugaba al visitar el centro.
63 3. TEORIADEJUEGOS
Algunos críticos opinan que la teoría de juegos es el Kriegspieldel siglo xx, un espejo en el que los estrategas militares ven reflejadas sus ideas preconcebidas. La comparación es admisible. aunque injusta. Es cierto que la teoría de juegos se convirtió en una especie de oráculo sobre estrategia. sobre todo durante las dos décadas que siguieron a Hiroshima. La dificultad es común a todos los oráculos: las respuestas que da la teoría de juegos dependen de la forma precisa de enunciar las preguntas.
¿Por qué es una teoría de juegos? Es un tópico de las biografías de la ciencia que se busquen en la personalidad del sujeto las rarones que le llevaron a escoger un campo dado. Sin embargo, es pertinente preguntarse por ello. Aunque el científico o el matemático es más un descubridor que un creador. existen una miríada de sendas por explorar. ¿Por qué se toma una yno otras?
Es más difícil llegar a respuestas sensatas delo que los historiadores de la ciencia serían capaces de admitir. Cuando se plantea a los mismos investigadores. suelen ser incapaces de explicarlo. Muchos se dieron cuenta de la fascinación de Van Neumann por jugar; se fijaron en su colección de juguetes y en su humor a veces infantil. En este sentido no era un caso atípico entre los científicos. Jacob Bronowski escribió en 1973: «Deben darse cuenta de que toda la ciencia yel pensamiento humano son, en cierto modo, una forma de juego. El pensamiento abstracto esJa neotenia* del intelecto, mediante el cual se pueden realizar actos sin finalidad aparente (otros animales sólo juegan cuando son jóvenes). para entrenarse para las estrategias a largo plazQ)).
" Retención de los caracteres juveniles después de haber alcanzado el estado adulto. Bronowski se refiere a que los animales juegan yexperimentan con su entorno durante su infancia, y luego se amoldan a la pauta de comportamiento más adaptada a su sihlación (compárense las actitudes del gatito juguetón yel viejo y comodón gato adulto).
64 EL DILEMA DEL PRISIONERO
La teoría de juegos no se refiere a «jugar», tal y como se entiende comúnmente. Estudia los conflictos entre seres racionales, que desconfían uno del otro. Van Neurnann escapó de la revolución y el terrorismo en Hungría, y luego del surgimiento del nazismo. Su relación con KIara fue constantemente conflictiva. En las cartas a su mujer, Johnny habla de engaños) reprimendas y desconfianzas sin límite. La teoría de juegos consiste en todo esto.
La teoría de juegos parece la creación de un cínico. Algunos críticos han comentado que el cinismo personal de Van Neumann llegó a influir en la teoría. Es concebible pensar que la personalidad de VOIJ Neumann le impulsara a explorar la teoría de juegos, en vez de otro tema. Es erróneo creer que Van Neumann construyó la teoría de juegos como una racionalización «científica» de su ideología personal o política. La teoría de juegos es un análisis matemático riguroso que surge de manera natural al mirar un conflicto desde un punto de vista razonable. Von Neumann no hubiera desarrollado la teoría de juegos en caso de no haber previsto con su intuición matemática que era un campo amplio y fecundo. Determinados métodos matemáticos utilizados en la teoría de juegos tienen gran afinidad con los que empleó Von Neumann al estudiar la mecánica cuántica.
Oficialmente, la teoría de juegos fue inspirada por el póquer, que Von Neumann jugaba aveces, aunque no demasiado bien. (En un artículo de Newsweek de 1955 se le considera un «ganador de tipo medio» en este juego.) En el póquer se debe tener en cuenta lo que los restantes jugadores están pensando. Este rasgo es lo que diferencia la teoría de juegos de la teoría de probabilidades, también aplicable a muchos juegos. Por ejemplo, sea un jugador de póquer que ingenuamente intenta usar sólo la teoría de probabilidades para hacer sus jugadas. El jugador calcula la probabilidad de que su mano sea mejor que las de los demás, y apuesta en proporción directa a la fuerza de sus cartas. Tras muchas manos, los
65 3. TEORfADEJUEGOS
otros jugadores adivinarán que, por ejemplo, su disposición a echar doce dólares al centro significa que tiene por lo menos un trío. Los jugadores de póquer ya saben que esta predicibilidad no es buena (el qne tiene «cara de póquer>, no delata su juego).
Los buenos jugadores de póquer no sólo apuestan por aprovechar una racha. Tienen en cuenta las conclusiones que los restantes jugadores puedan deducir a partir de sus propias actuaciones. La genialidad de Von Neumann consistió en darse cuenta de que esta tortuosa manera dejugar era racional y que podia ser objeto de un análisis riguuoso.
No todos piensan que la teoría de juegos fue la plasmaciónmás fructifera del talento de Van Neumann. Paul Halmos, ayudante de Von Neumann enPrincetoD, me comentó: «En mi opinión, simplemente perdia el tiempo con "esa cosa de los juegos". Sé de sobra que gran parte del mundo no está de acuerdo con las opiniones que tuve entonces, y yo tampoco estoy seguro de si ahora me gustan, pero [... ] jamás llle enteré del tema ynunca me gustó aprenderim),
¿Quiénfue el primero?
Van Neumann no tiene todo el mérito por haber creado la teoría de juegos. Desde 1921, siete años antes de que Van Neumann publicara su primer trabajo, el matemático francés Émile Borel hizo públicos varios artículos sobre la théorie du jeu. Estos trabajos y los de Von Neumann poseen marcadas semejanzas. Borel usó el póquer como ejemplo, y analizó el problema del faroleo, como lo hubiera hecho Van Neumann. Borel reparó en las posibles aplicaciones económicas y militares de la teoría de juegos. Incluso llegó a advertir contra las aplicaciones simplificadoras de la teoría de juegos a la guerra. No hablaba por hablar. Borel ocupó varios cargos públicos y fue ministro de la Marina francesa en 1925.
66 ELDILEMA DEI. PRISIONERO
Sobre todo, Bore! planteó las cuestiones esenciales de la teoría de juegos: ¿para cuáles juegos existe la mejor estrategia, y de qué manera puede uno buscar esa estrategia?
Borel no desarrolló mucho estas cuestiones. Van Neumano, al igual que tantos individuos creativos, tenía celos de ser el primero en descubrir «su» aportación. Su artículo de 1928 y el libro de 1944 apenas si mencionan a Borel, salvo en comentarios a pie de página. Por si hubiera alguna duda, Ulam dijo que uno de los trabajos de Borel había desde luego inspirado a Von Neumann.
Al no tenerla en cuenta, Van Neumann causó que se menospreciara durante mucho tiempo la obra de Borel. En 1953, quedó patente la irritación de Von Neumann, al darse cuenta de que se estaban traduciendo los artículos de Bore! al inglés. El traductor, el matemático L.). Savage, comentó a Steve Heims: «Me llamó muy enfadado desde algún lugar, Los Álamos O así. Posteriormente, escribió una recensión de los articulos en inglés. La crítica no mostraba su enfado. Era típico de él que la recensión estuviera escrita con toda educacióm).
A pesar de todo, el trabajo que dio a la luz a la teoría de juegos es, sin duda alguna, e! artículo de 1928, «Zur Theorie der Gesellschaftspiele» ('La teoría de los juegos de salón'). En él demuestra, cosa que no hizo Borel) su famoso «teorema minimax). Este importante resultado dio inmediato prestigio matemático a la nueva disciplina.
Teoría de juegosy comportamiento económico
Von Neumann quería que la teoría de juegos alcanzara a un público más amplio que a los matemáticos. Creía que la economía era el campo donde su desarrollo sería más provechoso. Se asoció con Wl economista austríaco, Osker Morgenstern, para así desarrollar la teoría.
67 3. TEORfADEJUEGOS
El libro de Von Neumann y Morgenstem, Theory ofGames and Economic Behavior, es uno de los más influyentes y menos leídos del siglo xx. Así lo confesaba la Princeton University Press, en un anuncio en la revista American Scientist para conmemorar el quinto año de unas ventas muy flojas. «Los libros importantes suelen tardar un tiempo en que se reconozca su valor [... ] Después, cuando el mundo ya conoce su importancia, su influencia es mucho mayor que su lectura.» El libro no llegaba a los cuatro mil ejemplares vendidos en cinco años, un hecho difícil de conjugar con la afirmación de que había conquistado el campo de la economía. La mayor parte de los economistas no lo habían leído aún (ni lo leerían); y ni siquiera estaba en las bibliotecas de muchas facultades de económicas. El anuncio decía que «cierto número de copias habían sido adquiridas por jugadores profesionales».
Theory ofGames and EconomicBehaviores un libro difícil de leer. Actualmente quita un poco las ganas de tragarse 641 páginas llenas de fórmulas, que Von Neumann y Morgenstem hayan sido superados en su tratamiento de los juegos de más de dos participantes. Su planteamiento, aunque correcto, no es ya el más práctico ni el más comprensible.
Hay algo que abunda en el libro, y es la ambición. Von Neumann y Morgenstern soñaban con hacer por la economía lo que Von Neumann hizo por la física cuántica, y que no pudo obtener para las mismas matemáticas: darle una fundamentación axiomática. Los autores afirman: «Esperamos mostrar adecuadamente [...] que los problemas típicos de comportamiento económico son rigurosamente idénticos alas soluciones matemáticas de determinados juegos de estrategia».
Por consiguiente, presentan el libro Theory ofGames and Economic Behavior como una obra pionera en el área de la economía. La introducción del libro casi pide excusas por investigar los juegos de ocio. Estos juegos se utilizan como modelos posibles de interacción económica. (No se mencio
68 EL DILEMA DEL PRISIONERO
nan las aplicaciones militares, que serían tan importantes para los seguidores de Von Neumann.)
El libro tiene un estilo iconoclasta. Van Neumann y Morgenstern insisten en que los economistas deberían empezar de nuevo. Critican la situación de las matemáticas de la economía en ese momento. ylas comparan con la física prekepleriana y prenewtoniana. Reprenden a aquellos que defienden reformas económicas basadas en teorías no comprobables. Se podría suponer que se referían al marxismo, entre otras teorías.
El futuro que predicen los autores es que una ciencia exacta de la economía precisaría sus propias matemáticas, aún por descubrir. Sugieren que el cálculo infinitesimal, que se creó a partir de la física de los cuerpos ponderables y sometidos al movimiento, ha sido sobrestimado en las matemáticas.
Por fortuna para nosotros, el núcleo esencial de la teoría de juegos es fácil de entender, incluso para aquellos que poseen poca formación matemática o escasa simpatía por esta disciplina. La teoría de juegos se basa en una manera muy sencilla y sin embargo precisa de esquematizar un conflicto; este método se puede enseñar utilizando juegos infantiles conocidos.
Repartirse un pastel
Muchas personas saben cuál es la mejor forma de que dos críos caprichosos se repartan un trozo de tarta. No importa el cuidado que el padre tenga para cortarla; uno de Jos niños (iO incluso ambosi) pensará que se le ha dejado el trozo más pequeño. La solución consiste en que uno de ellos corte la tarta y que el otro escoja el trozo que quiere. Gracias a la glotonería, será una partición justa. El primer niño no podrá quejarse de que la división es injusta porque la ha hecho él.
69 3. TEORfA DEJUEGOS
El segundo no podrá protestar, pues ha podido escoger el trozo que prefería.
Esta discusión doméstica no sólo es un juego en el sentido dado por Van Neumann, sino que es prácticamente el ejemplo más simple posible del principio «minimax» en el que se fundamenta la teoría de juegos.
El problema del pastel es un conflicto de intereses encontrados. Ambos niños quieren lo mismo: la mayor cantidad posible de tarta. La división de la tarta depende, en último caso, tanto de la manera en que un niño corta la tarta, como del trozo que el otro niño escoge. Es fundamental que cada niño prevea lo que va a hacer el otro. Esto define la situación como un juego en el sentido dado por Von Neumann.
La teoría de juegos busca soluciones -resultados racionales- a los juegos. Dividir la tarta equitativamente es la mejor estrategia para el primerniño, ya que sabe de antemano que la estrategia delotro niño será tomar el pedazo mayor. La solución de este juego es, por tanto, la equipartición de la tarta. Este resultado no depende de la generosidad de los niños, ni de su sentido de lo que es justo. Surge forzosamente a partir del interés propio de cada uno. Precisamente son soluciones de este tipo las buscadas por la teoría de juegos.
jugadores racionales
Teniendo en cuenta el ejemplo anterior, reexaminemos algunas ideas presentadas más arriba. Existen muchas maneras de practicar juegos. Puede jugar por divertirse, sin pensar en ganar o perder. Puede jugar temerariamente, con la esperanza de que tenga suerte y así ganar. Puede jugar basándose en que su contrincante es un necio, y aprovecharse de su necedad. Al jugar a las tres en raya con un niño, puede incluso jugar a perder. Todo esto está muy bien. La teoría de juegos no trata estas situaciones.
70 EL DILEMA DEl PRISIONERO
La teoría de juegos considera que los jugadores son totalmente racionales y sólo les interesa ganar. Cuando atribuyes a tu(s) oponente(s) una capacidad de raciocinio y el deseo de ganar, y juegas para lograr el mejor resultado posible para ti, se puede entonces someter el juego al análisis de la teoría dejuegos.
Unos jugadores con capacidad lógica perfecta son imposibles. como cualquier otra cosa perfecta. Una recta totalmente derecha no existe en la realidad. No por ello dejó Euclides de desarrollar un sistema de geometría muy práctico. Así sucede con Van Neumann y sus jugadores totalmente racionales. Puede imaginarse que los participantes de la teoría de juegos son como los lógicos perfectos de los que uno oye hablar en los rompecabezas lógicos. o incluso son como programas de ordenador, en vez de seres humanos. Se supone que los jugadores tienen un conocimiento total y una comprensión absoluta de las reglas, y una memoria perfecta que les permite recordar todas las jugadas anteriores. En cada fase del juego, siempre conocen todas las opciones lógicas posibles a partir de sus jugadas y las de su contrario.
Este último requisito puede ser muy exigente. Unos jugadores perfectamente racionales jamás se perderían una oportunidad de comer a un contrario jugando a las damas) y nunca «caerían en una trampa» en ajedrez. En las reglas de estos juegos están implícitas todas las secuencias permitidas de jugadas) y un jugador totalmente racional tiene en cuenta cada una de las posibilidades.
Mas como saben bien los que juegan a las damas o al ajedrez, las maniobras consisten sobre todo en tender trampas yen no ver posibles movimientos: tratar de que tu oponente caiga en las trampas, e intentar recobrarse tras caer uno en ellas. ¿Cómo sería un juego entre dos contrincantes perfectamente racionales?
Probablemente conoce el resultado final si se juega «racionalmente» a las tres en raya. Termina en un empate; es así
71 l. TEQRlADEJUEGOS
a no ser que alguien cometa una equivocación. Las tres en raya pierden su atractivo pronto porque se puede aprender a jugarlo perfectamente.
Van Neumann demostró, sin embargo, que muchos juegos tienen esta misma característica de las tres en raya. El ajedrez no es un juego, le dijo Van Neumann a Bronowski. Se refería a que existe una forma «correcta» de jugarlo, aunque nadie lo sepa de momento; una vez conocida, el juego sería trivial, en sentido similar a las tres en raya. para unos jugadores que supieran cuál es la estrategia «correcta».
Losjuegos son como árboles
La esencia de la demostración de Van Neumann es maravillosamente sencilla. No sólo es aplicable al ajedrez, sino a cualquier juego donde no se oculta información a los jugadores, es decir, en los que «todas las cartas están sobre la mesa».
Muchos juegos conocidos consisten en secuencias de jugadas realizadas por los jugadores. En las tres en raya, el ajedrez o las damas, la cuadrícula o tablero siempre está a la vista. No se hacen jugadas ocultas. En cualquiera de estos juegos se puede trazar un diagrama de todas las posibles secuencias de juego. Tomaré como ejemplo las tres en raya, porque es bastante sencillo, mas en principio se podría hacer lo mismo con las damas, el ajedrez o juegos parecidos. Las tres en raya comienzan al marcar el primer jugador Olamémosle X) una cualquiera de las nueve casillas. Por lo tanto, hay nueve posibles primeras jugadas. Se pueden representar las nueve opciones posibles del Jugador X como nueve rectas que salen hacia arriba desde un punto. El punto simboliza la jugada, el momento de la decisión, y las rectas representan las posibles opciones.
Ahora le toca al Jugador O. Hay ocho casillas aún disponibles; dependerá cuáles sean según el lugar que ocupe la X.
72 ELDllEMA DEL PRISIONERO
Así pues, dibuje ocho ramas secundarias en el extremo de las nueve ramas primarias. Esto deja siete casillas libres para que X haga su segundo movimiento. A medida que se prosigue con el diagrama de jugadas posibles, se ranüfica hacia arriba como si de un árbol frondoso se tratara.
Al continuar el proceso, llegará un momento en que en el diagrama se reflejen las jugadas que permiten tres marcas (iguales) en ma. Quiere decir que ha ganado el jugador que mueve en ese instante. También es el fmal de esa rama concreta del diagrama, ya que el juego finaliza cuando alguien consigue las tres en raya. Marque ese punto (lIámelo una «hoja» del árbol-diagrama) como una victoria para X o para 0, según corresponda.
Otras ramas del diagrama terminarán en un empate. Márquelas como empates. Es imposible continuar jugando a las tres en raya para siempre, por supuesto. El número máximo de jugadas es nueve. Así pues, llegará un momento en el que tendrá un diagrama completo del juego de las tres en raya. En el diagrama deben estar todas las jugadas posibles de tres en raya, todas las que se han jugado y todas las que se jugarán, representadas como una rama que empieza en la «raíz}) (la primera jugada de X), y sigue hasta llegar a una «hoja» señalada como una victoria para X, un empate o una victoria para O. Las ramas de mayor extensión, o jugadas completas más largas, contienen nueve movimientos. Las más cortas, cinco movimientos (es el mínimo para que el jugador que comienza pueda ganar).
Una vez que tenemos el árbol, cojamos ahora las tijeras de podar. Eliminando jugadas del diagrama, puede obtener los procedimientos para jugar «racionalmente» a las tres en raya. El diagrama contiene todas las secuencias de jugadas permitidas, incluyendo las que tienen movimientos estúpidos, como por ejemplo no ver una oportunidad de hacer las tres en raya. Todo lo que necesita es aplicar las tijeras al árbol y quitar todas las jugadas estúpidas. Queda
73 3. TEQRtAOEJUEGOS
rán las jugadas inteligentes l es decir, la forma racional de jugar.
Una pequeña parte del diagrama se asemejaría a lo siguiente:
Empate Xgana
Punto A .. (le toca a X)
Punto B Xgana..(le toca a O)
PuntoC (le toca aX)
Recorra el diagrama cuidadosamente y retroceda a partir de cada hoja. Éstas son la última jugada de alguien, y dieron lugar bien a una victoria, bien a un empate. Por ejemplo, el punto A de la figura representa el turno de X, y sólo hay una casilla vacía. X no tiene otra alternativa que rellenarla y provocar así el empate.
Ahora examinemos el punto B, que es una jugada anterior. Le toca jugar a 0 1 y tiene dos opciones posibles. Si pone un O en uno de los dos huecos libres, se llega al punto A mencionado más arriba. y a un empate seguro. Sin embargo, si pone el O en la otra casillal se llega a una victoria para X. Un jugador O racional preferirá un empate a una victoria de X. Por lo tanto l la rama hacia arriba de la derecha, a partir del punto B. no podría suceder jamás en un juego racional. Pode esta rama del diagrama. Pues si se alcanza el punto B en el juego, el empate es la conclusión evidente.
74 EL DILEMA DEL PRISIONERO
Pero, atención: X podría haber ganado antes, en el punto C. Un jugador X racional hubiera escogido de inmediato la victoria en el punto C. Luego de hecho podemos podar toda la rama izquierda del diagrama.
Si prosigue la poda hasta la raíz, descubrirá que los únicos resultados posibles para jugar racionalmente son los empates. (Sin embargo, hay más formas de jugar racionalmente.) El segundo jugador puede boicotear cualquier intento de ganarde X, yviceversa.
Lo que hemos hecho en las tres en raya se puede realizar para casi cualquier juego entre dos personas en el que no se oculta información. El requerimiento principal es que el juego ha de ser finito. No puede continuar siempre, y el número de posibles opciones en cada oportunidad debe ser también fmito. De otro modo, no habría «hojas~) (últimas jugadas) desde las que retroceder.
Los seres humanos no son inmortales; ningún juego de ocio pretende durar eternamente. Sin embargo, en las reglas de los juegos más complicados no se exige explícitamente que se lleven a cabo un número máximo de jugadas. El ajedrez suele terminar en tablas. Hay muchos casos en los que las piezas pueden moverse sin fin, y no llegar a tablas. Si se comieran todas las piezas salvo los dos reyes, ninguno podría hacer jaque mate al otro. Estas situaciones finalizan con unas «reglas de empate)). Una regla bastante aceptada afirma un empate cuando una secuencia de movimientos se repite tres veces seguidas. Otra. más restrictiva. señala que es un empate si en cuarenta movimientos no se mueve ningún peón y no se capturan otras piezas de mayor categoría.
Por 10 tanto, afirmaron Van Neumann y Morgenstern, dada una regla de empate determinada, hay un límite superior fmito al número de jugadas posibles de ajedrez. (Este límite se aproxima a los cinco mil movimientos, siguiendo las normas usuales -¡un número mucho mayor que el de cualquier partida de ajedrez que se haya jugado!-.) El valo~on-
75 J. TEORfADEJUEGOS
creto del límite no es importante para la demostración, basta saber que existe y que es finito. Dado que es limitado el número de movimientos en una partida de ajedrez, y que los movimientos posibles para cada jugada son finitos, se deduce que el número de secuencias posibles del juego completo es, asimismo, finito. Se podría trazar un diagrama de todas las formas completas de jugar permitidas, y podarlo para descubrir el modo racional de jugar al ajedrez.
Este método alude al viejo chiste sobre la partida de ajedrez. Las Blancas hacen su primera jugada, y a continuación las Negras dicen: «Abandono». El ajedrez, jugado entre oponentes perfectamente racionales, sería así de trivial. Que aún interese a los jugadores sólo se debe a nuestro desconocimiento de la estrategia correcta para jugarlo. Una cosa es demostrar que existe la mejor estrategia posible, pero otra es realizar los cálculos necesarios para obtener la estrategia. No se sabe si jugar racionalmente al ajedrez finalizaría en victoria (supuestamente para las Blancas, que empiezan la partida) o en tablas.
Los juegos como tablas
La teoría de juegos aporta otra manera de analizar los juegos, mucho más práctica. Un juego es equivalente a una tabla compuesta por los resultados posibles.
Como hemos visto, el número de partidas de ajedrez es de proporciones astronómicas, pero es finito. Se sigue que el número de estrategias de ajedrez es también finito. Ya he usado la palabra «estrategia~~ varias veces; ya es hora de precisar su significado. En la teoría de juegos, la estrategia es un concepto importante, con un sentido más concreto que el que se le da habitualmente. Cuando un jugador de ajedrez habla de estrategia, se refiere a algo parecido a «abrir con la defensa india y jugar con agresividad». En la teoría de jue
76 EL DILEMA DEL PRISIONERO
gas, una estrategia es un plan mucho más específico. Es la descripción completa de una forma determinada de jugar, independiente de Jo que hacen los demás jugadores y de la duración del juego. Una estrategia debe prescribir Jas acciones a realizar tan detalladamente, que nunca haga falta tomar una decisión al seguirla.
Un ejemplo de una verdadera estrategia para el primero que juega al tres en raya seria el siguiente:
Ponga una Xen la casilla central. El Jugador O puede reaccionar de dos maneras:
1. Si O marca en una casilla que no es una esquina, ponga unaXen una casilla que hace esquina, adyacente a la O. Así tiene dos en raya. Si O no le bloquea en su siguiente jugada haga las tres en raya para ganar. Si O le bloquea, ponga una Xen la celda que hace esquina que además no es la adyacente a la primera O (que tampoco estaba en una esquina). Así obtiene dos en raya de dos formas. Haga O lo que haga en la próxima jugada, podrá hacer tres en raya después y ganar.
2. Si por el contrario, la primera jugada de O es en una casilla que hace esquina, ponga una X en llna de las casillas adyacentes que no hacen esquina. Así tiene dos en raya. Si O no le bloquea en la jugada siguiente, haga las tres en raya para ganar. Si O le bloquea, ponga una Xen la esquina aliado de este segundo O, yen el mismo lado de la cuadrícula del primer O. Tendrá ya dos en raya. Si O no le bloquea en la siguiente jugada, haga las tres en raya para ganar. Si O le bloquea, ponga una Xen la casilla vacía aliado del tercer O. Así consigue dos en raya. Si O no bloquea en la próxima jugada, ya tiene las tres en raya para ganar. Si O le bloquea. ocupe la casilla que queda para empatar.
Esto muestra lo complicado que puede ser una estrategia, aun en el caso de un juego muy sencillo. Una verdadera estrategia para el ajedrez sería tan enorme que jamás se podría escribir. No hay la suficiente tinta ni el papel en la Tierra para hacer una lista de todas las posibilidades; no existe la suficiente memoria de ordenador para pasar por todas ellas.
77 3. TEORíA DE JUEGOS
Ésta es una de las razones por la que los ordenadores aún pueden ser derrotados al ajedrez.
Aunque sea una dificultad práctica abrumadora, no le preocupó a Van Neumann, ni debiera preocuparnos a nosotros. De hecho, puestos ya a imaginar cosas, podríamos ir un poco más allá. Un ser perfectamente racional no sólo podría pensar una estrategia detallada; también sería posible, dadas unas capacidades ilimitadas de memoria o potencia de cálculo de ordenador, que anticipara todas las estrategias posibles de ajedrez, yque decidiera de antemano su curso de acción incluso antes de mover la primera pieza.
Suponga que tiene una lista numerada de todas las posibles estrategias para el ajedrez. Su elección de estrategia se reduce a escoger un número, de 1 a n, donde n es el número (muy, muy grande) de estrategias posibles. Su contrincante podría seleccionar una estrategia de su lista de posibilidades
Estrategias de las Negras
2 3 m
1 Jaque mate aJas Negras en 37mov.
Tablas después de 102 mov.
Las Negras se rinden en 63mov.
Jaque mate alas Blancas en 42mov.
Estrategias delas Blancas
2 J.m. alas Negras en45 moyo
J.m. alas Blancas en 17mov.
J.m. alas Negras en 54mov.
J.m.alas Negras en 82mov.
3 J.m. alas Negras en43
J.m.alas Negras en 108mov.
Tablas después de 1.801
J.m.alas Blancas en 32mov.
mov. moyo
n Tablasen J.m.a J.m.a Tablas en 204mov. Negras en Negras en 842mov.
77mov. 24mov.
78 EL DILEMA DEL PRISIONERO
(de 1 a m). Una vez que se han decidido estas dos estrategias, el juego resultante estaría completamente determinado. Al llevar a cabo las dos estrategias, se podrían mover apropiadamente las piezas y llevar el juego a su término previsto. Tanto las aperturas, las capturas, los «movimientos de sorpresa» y la jugada de fin de partida estarían implícitas en la selección de estrategias.
Llevemos esta fantasía alucinante a su fin, imaginándonos que, si se diera el tiempo suficiente, se podría jugar cada par de estrategias enfrentadas para ver así su resultado. Las soluciones se podrían escribir en una tabla rectangular. La verdadera tabla abarcaría el tamaño de las galaxias, ¡así que aquí imprimimos una versión abreviada!
Una vez que tuviera esta tabla, no necesitaría más el tablero de ajedrez. Una «partida» de ajedrez se reduciría a que ambos jugadores escogerían a la vez sus estrategias, y consultarían el resultado en la tabla*. Para saber quién habría ganado, bastaría mirar en la casilla intersección de la fIla correspondiente a la estrategia de las Blancas, y la columna de la estrategia de las Negras. Si las Blancas escogieran la estrategia número 2 en su lista, y las Negras su estrategia número 3, el resultado sería inevitablemente jaque mate para las Blancas en 54 movimientos.
Ésta no es la manera en que las personas reales juegan de verdad. Tener en cuenta de antemano todas las contingencias posibles sería la antítesis de la palabra «jugar». No importa. Es muy útil esta idea de representar los juegos como una tabla de resultados. Para cualquier juego entre dos per
>1 ¿Por qué se exige que sea (la la vez»? ¿Acaso no pueden ver las Negras la primera jugada de las Blancas antes de decidir su estrategia? No es así, no se percibe lo abarcadora que debe ser una eSlrategia. La primera parte de una estrategia de las Negras exigiría una apertura de las Negras para cada una de las veinte posibles aperturas de las Blancas. Hasta que no se tengan en cuenta estas veinte contingencias. no se podría hablar de una estrategia en el sentido dado por Von Neumann.
79 3. TEORfADEJUEGOS
sanas. se puede representar cada secuencia posible del juego como una casilla en una tabla similar. La tabla deberá poseer tantas filas como estrategias tenga un jugadory una columna por cada estrategia del otro jugador. Si se estructura un juego de esta manera. se dice que está en «forma normai»,
El truco es decidir cuál estrategia se selecciona. La tabla expone claramente todas las opciones. pero a veces no basta con eso. Los resultados pueden estar distribuidos por la tabla de modo aleatorio. Ningún jugador llega a escoger el resultado que quiere, sólo la fJ.1a o columna en la que aparece. La selección del otro contribuye de igual forma.
Observe la tabla imaginaria para el ajedrez. ¡Es la estrategia número 1 una selección correcta para las Blancas? Es clifícil de decir. Si las Negras escogen la estrategia nÚJnero 1, es correcta, pues se llega a que las Blancas ganan. Pero si las Negras escogen otras opciones. el resultado puede ser un empate o que las Blancas pierdan.
Las Blancas quieren saber la estrategia que escogerán las Negras. Después, todo lo que tendrían que hacer es estar seguras de seleccionar una estrategia propia que lleve a ganar, al enfrentarla con la de las Negras.
Desafortunadamente, las Negras quieren lo mismo. Las Negras quieren analizar lo que harán las Blancas, y de ahí escoger su estrategia para llegar a una victoria. Por supuesto, las Blancas saben esto, y tratan de prever el comportamiento de las Negras basado en lo que creen que harán ellas, las Blancas...
Borel y Van Neumann se clieron cuenta de que estas deliberaciones sitúan a la teoría de juegos fuera del campo de la teoría de probabiüdades. Los jugadores se equivocarían por completo si pensaran que las decisiones de su contrincante se deben a la «casualidad)). El azar no tiene nada que ver con esto. Se espera que los jugadores hagan lo máximo posible por deducir cuál es la selección del otro, y disponerse ade
80 EL DILEMA DEL PRISIONERO
cuadamente para ello. Por consiguiente, hace falta tilla teoría nueva que dé cuenta de esto.
Juegos de suma cero
«Juegos de suma cero» es uno de los pocos conceptos que han calado en la jerga popular. Se refiere a los juegos en que las posibles ganancias netas o pagos están fijados de antemano. El mejor ejemplo de esto es el póquer, donde los jugadores ponen el dinero en el centro l y alguien se lo lleva todo cuando gana. Nadie gana un solo dólar que otro no baya perdido. La teoría de juegos ha logrado sus mayores éxitos en el ámbito de esta restringida pero bastante diversa categoría de juegos. Es natural realizar comparaciones con la economía. Se habla de que la sociedad es «de suma cero» porque el beneficio de una persona es en detrimento de otra: «No se da algo por nada»,
Lamayoria de los juegos de ocio son de tipo suma cero. Es válido incluso para aquellos en los que no interviene el dinero. Se arriesgue dinero o no, cada jugador preferirá unos posibles resullados a otros. Estas preferencias, al expresarlas mediante una escala nwnérica, reciben el nombre de «utilidad».
Considérese que la utilidad es el «contadon> del juego, o bien los «puntos» que trata de ganar. Si se apostara en el póquer con cerillas, y se intentara de verdad ganar la mayor cantidad posible, entonces la utilidad sería precisamente el número de cerillas obtenidas.
En un juego en que hay dinero, la utilidad es poco más o menos el dinero mismo. Cuando se juega sólo para ganar, el mero hecho de ganar aporta utilidad. En un juego de ganar o perder, como las tres en raya o el ajedrez, se podría asignar a la victoria un valor de utilidad igual a 1 (contabilizado en «puntos» arbitrarios); a la derrota, un valor de utilidad de (-1)
81 3. TEORfAOEJUEGOS
puntos. La suma total de utilidades seguiría siendo cero, por eso se trata de un juego de suma cero.
Es importante tener en cuenta que la utilidad se relaciona estrechamente con las preferencias reales de los jugadores. Si un adulto juega para perder con un niño, sus utilidades serían de signo contrario: perder tendría una utilidad igual a 1) y ganar tendría una utilidad de (-l). Así pues, la utilidad no se corresponde con el dinero, o con ganar o perder, o con otro fenómeno del mundo real.
El juego real más sencillo es uno entre dos personas) con dos estrategias y de tipo suma cero. El único modo de simplificarlo aún más sería que un jugador tuviera sólo una estrategia. Mas escoger sólo entre una opción posible) no es escoger realmente. De hecho, el «juego» lo llevaría a cabo un único jugador) cosa que no es en realidad un juego.
Un juego con dos participantes y dos estrategias puede representarse en una tabla de dos fijas por dos columnas. Si además es un juego de suma cero) se pueden reflejar con precisión los resultados. Rellene cada una de las cuatro casillas con un número que represente la victoria del primer jugador. Sabemos que si el primer jugador gana, el segundo forzosamente pierde, de modo que ambos pueden usar el mismo diagrama (las victorias del segundo jugador son los mismos números de la tabla pero con signo menos).
Minimaxy el pastel
Un juego de suma cero entre dos personas es una «guerra abiert"',. Un jugador gana sólo si el otro pierde. No es posible cooperación alguna. Van Neumann optó por una forma sencilla y sensata de tomar decisiones racionales para estos juegos. Se llama el principio minimax.
Examinemos de nuevo el problema del reparto de la tarta) desde el punto de vista de la teoría de juegos. Los niños
82 ELDILEMA DEL PRISIONERO
están jugando de manera «suma cero». Hay una porción limitada de tarta, y nada que puedan hacer los nrnos cambiará su tamaño. Si hay más tarta para uno, habrá entonces menos para el otro.
El primer niño (<<el que corta») tiene varias estrategias posibles; de hecho, hay un número ilimitado de ellas, pues podría cortar la tarta de infinitas formas. No perdemos precisión si reducimos las opciones a sólo dos estrategias. Una estrategia consiste en dividir la tarta en dos trozos desiguales, y la otra es dividirla lo más equitativamente posible.
El segundo niño (<<el que escoge») también tiene dos estrategias posibles. Puede escoger el trozo mayor o el más pequeño. (Añadiremos un toque más de realismo, al dar por hecho que no se puede cortar una tarta de manera perfecta. Por tanto, incluso cuando el que corta decide repartir la tarta equitativamente, siempre habrá un trozo ligeramente mayor que el otro.)
Se han representado las opciones en una sencilla tabla. Sólo hace falta poner el resultado de uno de los niños en cada casilla. Vamos a colocar los valores correspondientes al que corta. Obviamente, el que escoge se lleva lo que quede. La tabla tiene el aspecto siguiente:
Estrategias del que escoge
Escoger el Escoger el trozo grande trozo pequeño
Repartir lo más equitativamente posible
Estrategias del que reparte
Queun trozo sea mayor que el otro
La mitad del La mitad del pastel, salvo pastel, añadida una migaja una migaja
El trozo El trozo pequeño grande
83 3. TEORfADEJUEGOS
Ya conocemos el desenlace de este juego. El que corta dividirá la tarta lo más equitativamente posible. El que escoge tomará el pedazo más grande. El resultado aparece en la casilla superior izquierda. El que corta se llevará algo menos de la mitad de la tarta, ya que el que escoge habrá cogido el mayor de los dos trozos casi iguales.
¡Por qué se llega a este resultado? Si el que corta pudiera decidirse por cualquiera de los cuatro desenlaces posibles, querría llevarse el trozo grande (casilla inferior derecha). Sin embargo, se daría cuenta de que no es una opción realista. El que corta sabe qué puede esperarse del que escoge: es decir, lo peor: un trozo lo más pequeño posible.
El que corta sólo tiene la potestad de seleccionar la fila en que aparecerá el desenlace de la división de la tarta. Espera llevarse la porción más pequeña en esa fila, ya que el que escoge actuará de modo que el trozo del que corta sea lo menor posible. Por tanto (el que corta), tratará de maximizar el mínimo que le dejará el que escoge.
El que corta sabe que si lo hace con justicia, se llevará al final casi la mitad del pastel. Pero si corta un trozo más grande, sabe que se quedará con el pedazo más pequeño. La verdadera elección existe entre llevarse casi la mitad o bien mucho menos que la mitad del pastel. El que corta tratará de llevarse casi la mitad de la tarta, partiéndola para ello equitativamente. Este valor, que es el mínjmo de la fIla del máximo, se llama el «maximim).
«Sabes ya que lo más a lo que puedes aspirar es a evitar lo peon>, escribe Italo Calvino en el libro Se una notte d'inverno un viaggiatore (1979) (ed. cast.: Si una noche de invierno un viajero, Barcelona, 1983). El epigrama enuncia con claridad el principio del minimax. La selección de estrategias es así un resultado obvio. No es solamente el resultado «justO», recomendado por el arbitraje de la teoría de juegos, sino un equilibrio real obtenido forzosamente a partir de los intereses propios de los jugadores. Un participante se separa de su estrategia ópti
84 EL DILEMA DEL PRISIONERO
ma sólo en su propio perjuicio (y para beneficio de su contrincante, pues se trata de un juego de suma cero).
El principio minirnax es una ayuda para ver con más claridad otros juegos más complejos de suma cero entre dos personas. Hemos visto que casi cualquier juego normal es equivalente lógicamente a una elección simultánea de estrategias por parte de los jugadores. Un juego simultáneo es, por tanto, distinto al juego de dividir la tarta, en el que uno escoge después de actuar el que parte.
Pero, atención: ¿y si el que escoge tuviera que decir primero su elección (el pedazo grande o el pequeño), antes de que el que divide tomara el cuchillo? No habría ninguna diferencia. Un jugador racional sabe que el que corta dividirá la tarta de modo que el trozo del que escoge sea lo más pequeño posible. El que escoge quiere que el que corta se lleve asimismo el menor trozo posible. (Recuerde que la tabla anterior informa sobre el pedazo del que corta, que es el complementario del que escoge.) El que escoge busca el máximo de la columna de los mínimos (el minimax). Está también en la casilla superior izquierda. El que escoge debería tratar de llevarse el pedazo más grande.
En este juego, la casilla superior izquierda es el resultado más obvio, independientemente de cuál jugador anuncia primero su estrategia. Por lo tanto, podemos decir con seguridad que la casilla superior izquierda sería el desenlace lógico de una partida en la que los jugadores tuvieran que decidir simultáneamente.
El valor representado en la casilla superior izquierda es, a la vez, el maximin (el resultado «realista» del juego, mejor para el que corta) y el minimax (el resultado realista, mejor para el que escoge; aquí se representa como lo que le quedaría al que corta). Podría plantearse si es una casualidad, o bien si siempre sucede así. Se trata de una coincidencia, mas suele ser frecuente en una tabla pequeña. Cuando coinciden el maximin y el minimax, se dice que el resultado es un
3. TEORIAOEJUEGOS
«punto de silla). Van Neumann y Morgenstern compararon este punto con un lugar en medio de un desfiladero entre montañas, con forma de silla de montar: es a la vez la altitud máxima que puede alcanzar un viajero que siguiese la dirección del desfiladero, y la altitud mínima alcanzada por una cabra montesa que siguiera la dirección de los picos de las montañas.
Si un juego tiene un punto de silla, este punto es la solución del juego, es decir, el resultado esperado de jugar racionalmente. Observe que una solución racional no es necesariamente la que hace feliz a todos. El que corta acaba por llevarse una migaja o dos menos que el que escoge. Podría pensar que no es justo. Ya puestos, ambos jugadores pueden estar desilusionados por no haberse llevado un trozo mucho mayor. Ninguno de los jugadores obtiene el resultado de su primera selección. ¿Qué impide que los jugadores se rebelen yse comporten imprevisiblemente?
La respuesta es que se lo impiden la codicia y la desconfianza. La mitad de la tarta, salvo una migaja, es lo más que el que corta puede garantizar que obtenga sin la ayuda del que escoge. Es, asimismo, el trozo más pequeño que el que escoge puede dejarle al que corta, por su propia cuenta. Para hacer algo mejor, un jugador necesitaría la colaboración de su oponente. Sin embargo, el oponente no ve razón alguna para ayudarle; se llevaría menos tarta. La solución del punto de silla de un juego de suma cero se refuerza a sí misma. Es parecido a intentar abrir una botella cuyo tapón resbala. Cuanto más luchas para mejorar, peor estás.
Estrategias mixtas
Desafortunadamente, hay un fallo. No hay puntos de silla en todos los juegos. El problema surge porque se pueden inventar las reglas que se quieran. Se puede obtener cualquier
86 EL DI LEMA DEL PRISIONERO
conjunto de ganancias. Es fácil rellenar una cuadrícula con números, de manera que el máximo de la fila de los mínimos no es igual al mínimo de la columna de los máximos; luego no hay punto de silla.
Uno de los juegos más simples carece de punto de silla. «Emparejar centavos» (usado como un ejemplo por Van Neumann y Morgenstern) apenas puede decirse que es un juego en el sentido usual de la palabra. Dos jugadores ponen a la vez una moneda de centavo encima de una mesa, y se comprueba si han salido cara o cruz. Si las monedas coinciden (ambas son cara o cruz), el primer jugador se lleva las dos. Recupera su moneda y gana la de su contrincante al beneficio neto de un centavo. Si las monedas no coinciden, se las lleva el segundojugador.
La tabla para emparejar centavos tiene el siguiente aspecto:
Cara Cruz
Cara
Cruz
1centavo -1 centavo
-1 centavo 1centavo
El mínimo de ambas filas es -1 centavos. Por tanto, el mÍnimo máximo (el más grande) es asimismo -1 centavos. El máximo de las dos columnas es 1 centavo, por lo que el máximo mínimo (el más pequeño) es también 1 centavo. Existe una diferencia de 2 centavos entre el minimax y el maximin.
Von Neumann y Morgenstern comparaban los juegos a un «sogatira». Cada bando puede impedir que el contrario gane mucho terreno, y sin embargo hay una zona central donde la cuerda va a un lado y al otro. En el juego de emparejar centavos. el primer jugador puede estar seguro de obtener su valor de minimax (-1 centavo), que no aporta gran cosa en este caso, pues es la máxima pérdida posible en el juego. El segundo jugador sabe seguro que no puede perder más de un centavo. Es la diferencia entre estos dos sucesos seguros, los 2 centavos) lo que está realmente en juego en la partida.
87 3. TEOR1A DE JUEGOS
¿Debería apostar a cara o cruz? Obviamente, todo depende de lo que hará el otro jugador. Si supiera lo que va a hacer el contrincante, sabría qué hacer; y viceversa.
Como probablemente sabe, la mejor manera de que coincidan caras o cruces, es jugar a unas y a otras aleatoriamente (con una probabilidad del 50% cada una). Esto recibe el nombre de «estrategia mixta», a diferencia de las «estrategias puras» consistentes en jugar a cara O a cruz siempre. Las estrategias mixtas no eran nada nuevo en tiempos de Von Neumann. El articulo de Borel tenía en cuenta tales estrategias; y por supuesto hacía ya tiempo que los jugadores de «emparejar centavos» y otros juegos parecidos, han dado importancia a la posibilidad de actuar al azar. Algunas veces. emparejar centavos se utilizan para decidir de manera «aleatoria» quién tiene la ventaja del comienzo en otro juego, como por ejemplo los que volean primero al béisbol.
Si se diseña una nueva estrategia aleatoria, partiendo de cero, los jugadores pueden crear un equilibrio que se refuerza a sí mismo. Hagamos un diagrama nuevo para emparejar centavos, incluyendo la estrategia aleatoria.
Cara Cruz AJazar
Cara
Cruz
Al azar
1centavo -1 centavo O
-1 centavo 1centavo O
O O O
Si alguien juega aleatoriamente, tiene las mismas probabilidades de ganar y de perder un centavo. (Esto es verdad tanto si el contrincante juega una estrategia pura como si elige también al azar.) La ganancia media para un jugador al azar es cero. Rellene la fila y columna para la estrategia aleatoria con ceros.
Ahora hay un punto de silla. Si el primer jugador tuviera que decir antes su estrategia (siempre cara, siempre cruz) o
88 El DILEMA DEL PRISIONERO
bien al azar), sabiendo que el segundo aprovecharía a fondo esa información, trataría de escoger la estrategia del múümo máximo (el más grande). Las estrategias de cara o cruz tienen unos mínimos de -1 centavos. La estrategia al azar garantiza una ganancia media nula, haga el otro jugador lo que quiera. Por lo tanto, la estrategia aleatoria tiene el mínimo máximo (el más grande).
Si el segundo jugador fuera el que empezara, preferiría el máximo mínimo (el más pequeño). De nuevo, corresponde a la estrategia aleatoria. La teoría de juegos propone, como desenlace obvio, elvalor de la casilla inferior derecha. Por lo tanto, ambos jugadores deberían escoger aleatoriamente. De nuevo nos encontramos con un equilibrio entre los intereses encontrados de los jugadores.
Muchos niños de cinco años saben ya jugar a «emparejar centavos». ¿Para qué necesitamos la teoría de juegos?
La respuesta es que otros juegos no son tan sencillos, yen estos casos, la teoría de juegos puede prescribir de manera totalmente correcta soluciones que no parecen en absoluto de sentido común. Las probabilidades en una estrategia aleatoria no tienen por qué ser mitad y mitad. Pueden y deberían ajustarse a las ganancias. La teoría de juegos explica cómo hacerlo.
He aquí un pequeño y divertido dilema: «Emparejar centavos para ganar una fortuna». Funciona igual que la versión normal de emparejar centavos, salvo que usted sólo juega con oponentes fabulosamente ricos) de modo que si salen dos caras, le tiene que pagar un millón de dólares. Sus resultados son como siguen (los de su contrincante son los correspondientes opuestos):
Cara Cruz
Cara Un millón -1 centavo de dólares
Cruz -1 centavo 1centavo
89 3. TEORIA DE JUEGOS
¡De qué manera debería jugar? Desde luego, los centavos no dan para nada. Le interesa ganar ese millón de dólares. La única forma de que esto suceda es que juegue a obtener cara. Así que, en un primer impulso, decide jugárselo a cara.
Pero, espere un momento) su contrincante tendría que estar chiflado si se lo jugara a cara. No arriesgaría perder un millón de dólares. Su primer impulso es jugárselo a cruz.
Si prevalecieran los primeros impulsos) usted jugaría a cara y su oponente a cruz. No habría emparejamiento de las monedas, y perdería usted un centavo) que se llevaría el otro. ¿Qué es esto? ¿No estaba el juego a mi favor?
Si lo analiza con mayor rigor, se dará cuenta de que su contrincante no tiene más remedio que escoger cruz. Así no sólo impide que usted gane mucho (y él pierda mucho), además se lleva un centavo cada vez que usted escoge cara y él escoge cruz.
Pero ese juego pueden hacerlo dos. Por lo que usted sabe, su oponente va a escoger cruz con casi total seguridad; puede aprovecharse de este hecho. Escoja cruz, y seguro que se lleva un centavo.
Quizá su contrincante prevea su doble juego. Por tanto, podría estar tentado de jugar a cara, o quizá no; de este modo está arriesgando un millón. Sin embargo, en caso de haber una posibilidad de que escoja cara, podría usted reconsiderarlo y jugárselo a cara. Puede desde luego arriesgarse a perder un centavo para apostar por un millón...
La teoría de juegos predice que la estrategia mixta correcta es jugar a cruz casi siempre. Debería jugar a cara con una probabilidad de unas dos veces en cien millones (la proporción exacta es 2 de cada 100.000.003)*. Su contrincante debería hacer exactamente lo mismo.
* No me meto en los cálculos matemáticos porque no se necesitan para comprender problemas de tipo social. Para un juego de «emparejamiento generalizado de centavos» -un juego de suma cero entre dos
90 EL DILEMA DEL PRISIONERO
La ganancia del millón de dólares, que parece una auténtica suerte, es una ficción más que otra cosa, puesto que el otro jugador puede boicotearla. El juego estándar de emparejar centavos es equitativo y con valor esperado cero. La versión millonaria es a su favor. pero sólo aproximadamente en la cantidad de un centavo por partida. Que es, por supuesto, lo que gana al emparejar cruces. ¡El resultado neto de la solución del millón de dólares consiste en aumentar sus ganancias medias en un centavo! No se modificarían mucho sus expectativas de juego en el caso de aumentar la cantidad a un trillón de dólares o a n millones de dólares.
El otro sorprendente hecho es que se recomienda al segundo jugador que juegue a veces la arriesgada estrategia de caras. No es que opte por esta jugada muchas veces, y es aún más difícil dar una justificación lógica del lance. He aquí una
personas. con dos estrategias por persona-la estrategia mixta correcta es fácil de calcular. Escriba los resultados en la habitual tabla de dos por dos. Calcule las diferencias entre los dos resultados en cada fila yescríbalos a la derecha de la tabla, como sigue:
1.000.000 -0,01 1.000.000,01 -0,01 0,01 -0,02
Haga que los resultados sean positivos (-0,02 pasa a ser 0,02) e inter· cambie su posición:
1.000.000 -0.01 0,02 -0,01 0,01 1.000.000,01
Esto quiere decir que las probabilidades correspondientes a la proporción (caras: cruces) es 0,02 : 1.000.000,01, o bien (multiplicando por 100 para eliminar los decimales) es 2: 100.000.001. El otro jugador calcula sus probabilidades al estimar la diferencia en las colwnnas y luego intercambiarlas. En este caso, las probabilidades son las mismas para ambos jugadores. Se complica más para juegos con más de dos estrategias. Si el tema le interesa, lea el libro The Compleat Strategyst de Joho Williams.
91 3. TEORIA DE JUEGOS
forma de verlo. El juego consiste en que uno de los participantes juega a cruces (casilla inferior derecha). Pero si el segundo jugador se atuviera a jugar siempre a caras. se eliminaría cualquier posibilidad de que usted se llevara el millón de dólares. Asimismo, jamás tendría motivación alguna para jugar a caras.
El segundo jugador (que casi siempre juega a cruces) prefiere que usted juegue a caras. Esta actitud casi siempre le va a permitir ganar. Tiene que jugar a veces a caras, para incitarle a usted a jugar a caras de vez en cuando. Además. en estas ocasiones suele ganar porque usted suele jugar a cruces.
Un rayo no cae dos veces en el mismo sitio. Si ambos jugadores juegan a caras raramente, los muchísimos casos posibles en que salga sólo una cara (y por ello un centavo para el segundo jugador) equilibrarán la poco frecuente catástrofe de que coincidan los dos jugando a caras. Por consiguiente, se tiene una estrategia mixta «óptima», en la que se juega a caras muy raramente pero no se evitan por completo.
Bolas con efecto y genes asesinos
Una vez comprendido el concepto de estrategias mixtas, se verá que se pueden descubrir en todos lados. Vamos a citar algunos ejemplos.
Los lanzadores de béisbol hacen mejor algunos tipos de lanzamientos que otros. Dadas las mismas circunstancias, el bateador esperaría que el lanzador hiciera siempre la volea que mejor le sale. Mas el bateadortendría una gran ventaja si supiera cómo sería ellanzamiento. Por ello. los lanzadores hacen una serie aleatoria de bolas rápidas, bolas lentas, bolas en curva y con los nudillos. para desorientar al bateador. Las excepciones sólo confirman la regla. Preguntaron a Satchel Paige cómo podía salir bien parado lanzando siempre bolas rápidas, y contestó: «Saben lo que les espera. pero no saben por dónde vendrá».
92 ELDllEMA DEL PRISIONERO
En principio, la teoría de juegos podría predecir la combinación óptima de lanzamientos. La combinación variaría según la fuerza relativa de los lanzamientos de cada jugador. Será necesario realizar estadísticas bastante precisas: cuántas carreras se han hecho a partir de determinado lanzamiento, detenidas en condiciones ideales por el bateador. Sería interesante comprobar hasta qué punto se asemejan las estrategias instintivas del lanzador a las de la teoría de juegos. Las matemáticas empleadas no tendrían más dificultad que las estadisticas de béisbol al uso, cosa que parece un posible proyecto para un futuro Bill James.
En fecha tan temprana como 1928, Oskar Morgenstern descubrió un dilema en la novela Las aventuras de Skerlock Ho/mes, de Arthur Conan Doyle. Aparece citada en el libro suyo y de Van Neumann:
Sherlock Holmes quiere ir de Londres a Dover, y de ahí al continente, para escapar de su perseguidor, el profesor Moriarty. Una vez subido al tren, cuando éste sale de la estación, observa que el profesor Moriarty aparece en el andén. Sherlock Holmes supone, con toda razón, que su enemigo. tras haberle descubierto, podría tomar un tren especial y adelantarle. Sherlock Holmes puede continuar hasta Dover O bien apearse del tren en Canterbury, la única parada intermedia. Su adversario, cuya inteligencia se supone perfectamente capaz de prever estas posibilidades, tiene las mismas opciones. Ambos oponentes deben elegir el lugar donde se bajen del tren, sin conocer la decisión del otro. Si al fmal, como resultado de estas elecciones, se encontraran en el mismo andén, Sherlock Holmes haría bien en suponer que el profesor Moriarty le mataría. Si Sherlock Holmes llegase a salvo a Dover, podría escapar sin problemas.
Von Neumann y Morgenstern llegan incluso a asignar puntuaciones a los diversos desenlaces, y calculan una estrategia mixta. Recomiendan que Moriarty vaya directamente a Dover con una probabilidad de éxito del 60%, y que vaya a
93 3. TEORíA DE JUEGOS
Canterbury con una probabilidad del 40%. Holmes debería apearse en Canterbury (probabilidad del 60%) o en Dover (probabilidad del 40%). El juego no es equitativo, y las opciones favorables a Moriarty tienen más oportunidades de prevalecer.
En la novela de Doyle, Holmes se baja en Canterburyyve pasar el tren especial de Moriarty en dirección a Dover. Es interesante observar que tanto Holmes como Moriarty siguieron la opción más común, según la estrategia mixta de Van Neumann y Morgenstern. Escriben: «Desorienta un poco que esta opción lleve al triunfo completo para Sherlock Holmes, cuando ya hemos visto más arriba que las probabilidades (es decir, el valor del juego) desde luego están a favor de Moriarty [... ] Nuestro resultado [...] da que Sherlock Holmes tiene una probabilidad de un 48% de estar muerto, nada más salir de la estación Victoria)).
Este tipo de engaño premeditado se asemeja a echar faroles en el póquer. El póquer puede ser bastante complejo, sobre todo porque suele tener más de dos jugadores. Van Neumann estudió una forma simplificada de póquer. En líneas generales, sus conclusiones pueden aplicarse al juego real. Demostró que siempre hay que envidar fuerte cuando se tiene unajugada importante. Con una jugada floja, hay quefarolear a veces (en resumen, realizar lances agresivamente en todos los casos).
VonNeumann daba dos razones para echar faroles. Un jugador que nunca los echa) pierde muchas oportunidades de romper los faroles de otros jugadores. Suponga que usted y su contrincante tienen ambos una mala jugada. Usted no echa elfaral; pero sí su oponente. Por tanto) usted se lo cree y su adversario gana sin enfrentar las manos. Si usted hubiera faroleado, se verían su pésima mano y la del contrario, y quizá podría haber ganado. El que engaña puede abusar del que no engaña; por lo tanto, según Van NeumannJ el jugador racional debe engañar.
E[ farol es además una cortina de humo. Al igual que al emparejar centavos) uno pretende que el otro jugador esté
94 EL Dll.EMA DEL PRISIONERO
siempre adivinando. Al principio las manos de póquer se reparten aleatoriamente, mas los jugadores enjuician las jugadas de sus contrarios a partir de sus lances. Si se farolea con prudencia, el jugador impedirá que su comportamiento sea demasiado predecible.
La teoría de juegos tiene importantes analogías en la biología. Una persona que hereda el raro gen de la anemia falciforme de uno de sus progenitores posee mayor inmunidad a la malaria; pero si lo hereda de ambos, desarrolla la enfermedad. que es mortal. La paradójica supervivencia de este y otros genes asesinos se debe probablemente a que existe un equilibrio parecido a la versión «millonaria» del juego de emparejar centavos.
En este juego, un participante se arriesga a seguir de vez en cuando la estrategia de «caras» para obtener un beneficio que se materializa justo cuando juega a caras. El gen de la anemia falciforme es también peligroso, pero reporta ventajas cuando sólo un gen está presente. Como el gen es ya de por sí raro en la población, son escasos los sucesos de la enfermedad, comparados con los de mayor inmunidad. Se piensa que debe ser la razón por la que este gen aparentemente perjudicial se ha mantenido en zonas donde la malaria es endémica.
Podría plantearse qué relación tiene esto con la teoría de juegos. Los genes no pueden decidir estrategias mixtas o de cualquier otro tipo. Es decir. tomar decisiones conscientes no es esencial a la teoría de juegos. En el nivel más abstracto posible. la teoría de juegos trata de tablas rellenas de números, los cuales tratan de ser maximizados o minimizados por determinadas fuerzas. No importa que estas fuerzas sean jugadores de póquer que desean ganar el mayor dinero posible, o bien genes que se reproducen mecánicamente tanto como lo permite la selección natural. Más adelante hablaremos con mayor detalle sobre las aplicaciones de la teoría de juegos a la biología.
3. TEORIA DE JUEGOS
El teorema minimax
El teorema minimax demuestra, para cualquier juego de suma cero, finito ycon dos jugadores, que existe una solución racional bien como una estrategia pura, bien como una estrategia mixta. El lugar que ocupa Van Neumann como fundador de la teoría de juegos se basa sobre todo en su demostración del teorema minimax en 1926. Van Neumann pensaba que el teorema era de vital importancia. Escribía en 1953: «Tal como yo lo veo, no podría existir la teoría de juegos con fundamentación sin este teorema [... ] Durante el período considerado, creía que no había nada que valiera la pena publicar hasta que no demostrara el "teorema minimax").
Hablando de manera más habitual, el teorema minimax establece que siempre existe una solución racional para un conflicto, definido con exactitud, entre dos personas cuyos intereses son totalmente opuestos. Es una solución racional en el sentido en que ambos participantes pueden convencerse a sí mismos de que no podrían hacer nada mejor, dada la propia naturaleza del conflicto.
Las recomendaciones de la teoría de juegos son prudentes. Son lo mejor que puede esperar un jugador racional, al enfrentarse a otro jugador racional. No garantizan el mejor resultado posible. Normalmente, un jugador puede hacerlo mejor por sí mismo, al jugar contra un adversario irracional. A veces, estas ganancias las obtiene incluso el jugador racional que sigue la estrategia recomendada. Otras situaciones obligan a que el jugador racional se desvíe de la estrategia propuesta por la teoría de juegos, para aprovechar la irracionalidad del contrincante. Un ejemplo es el juego de emparejar centavos. Suponga que usted es el que tiene que emparejar, y sigue la táctica de combinar al azar cara y cruz. Pero se percata de que su contrario, menos racional, escoge sin darse cuenta «cara», más de la mitad de las veces. Por tanto, puede usted salir ganando si escoge «cara) con más frecuencia.
96 EL DILEMA DEL PR.ISIONERO
A pesar del sentido común de esta adaptación, la estrategia modificada no es ya la óptima, y posibilita que usted caiga víctima de los demás (por ejemplo, debido a un tercer jugador, o si su adversario irracional de repente se tornara más «listo»).
juegos de n personas
Un periodista preguntó una vez a Van Neumann si la teoría de juegos permitiría enriquecerse muchísimo en la Bolsa. Van Neumann respondió, bastante honradamente) que no era posible. Sin embargo, seguían en el aire preguntas de este tipo. ¿Para qué servía la teoría de juegos? ¿Para qué otra cosa aparte de los juegos podría emplearse?
El propio Van Neumann veía el teorema minimax: como la piedra angular de una nueva ciencia económica. Con este fin, gran parte del libro de Von Neumann y Morgenstern trata de juegos con tres o más personas. Elnúmero de «jugadores}) implicados en un suceso de tipo económico es casi siempre elevado, incluso enorme, y no pueden hacerse hipótesis simplificadoras.
Un juego con un número arbitrario de personas se llanla un «juego de n personas}). Estudiar completamente estos juegos es mucho más complicado que para los juegos de suma cero y dos personas. Es menos apropiado hablar de conflictos de intereses. Lo que es válido para el jugador A puede ser malo para el jugador B, pero bueno para el jugador C. En estas circunstancias, A y e podrían aliarse. Estas coaliciones cambian radicalmente un juego.
En un juego entre tres personas es posible que dos personas que actúan de común acuerdo aseguren el triunfo. De esta manera, dos aliados podrían dejar a un tercer jugador sin ganancias. Von Newnann y Morgenstern trataron de establecer cuándo suelen hacerse estas alianzas y quiénes po
97 3. TEORlADEfUEGOS
drían formarlas. ¿Se combinarían jugadores débiles contra un jugador fuerte? ¿O bien se asociarían los jugadores débiles al jugador fuerte? Se llegó a la conclusión de que eran estables muchas alianzas posibles. Por consiguiente, es difícil o imposible predecir lo que vaya a suceder.
Van Neumann tenía la esperanza de emplear el teorema minimax para enfrentarse ajuegos con un número creciente de participantes. El teorema minimax aporta una solución racional para cualquier juego de suma cero entre dos personas. Se puede dividir un juego de tres personas en subjuegos entre las posibles coaliciones. Si el jugador A y el jugador B se unen contra el jugador C, el juego resultante (la coalición de A y B contra C) tiene lugar efectivamente entre dos personas; su solución está garantizada por el teorema minirnax. Si se calculan las soluciones para todas las coaliciones posibles, los jugadores A, B YC podrían decidir cuál alianza sería más favorable. Se podría obtener así una solución racional a un juego entre tres personas.
No hace falta detenerse aqui. Un juego entre cuatro personas puede dividirse en juegos de dos y tres personas entre sus coaliciones potenciales. Calcule todas las probabilidades> y tendrá una solución evidente. De los juegos de cuatro personas se llega a los de cinco, seis yasí hasta el infinito.
Desafortunadamente, la complejidad de los juegos y los cálculos necesarios se incrementan de forma exponencial con el número de jugadores. Aunque la economía mundial pudiera modelarse como un «juego» entre cinco mil millones de participantes. sería de poca ayuda práctica. En su mayor parte, las investigaciones de Von Neurnann y Morgenstern en el campo de la economía nunca consiguieron del todo sus objetivos. Será otro el que desarrolle sus fundamentos.
A pesar de ser un gran matemático, Von Neumann no trató de ceñirse con su teoría a este ámbito. Por ejemplo, la geometría surgió de problemas relativos a medir terrenos. Hoy,
98 EL DlLEMA DEL PRISIONERO
sin embargo, no nos parece extraño utilizar la geometría para cuestiones que nada tienen que ver con la propiedad. Un rectángulo es un rectángulo, bien sea la granja de alguien o bien sea un rectángulo abstracto en una demostración geométrica. Van Neumann y Morgenstern explican que un juego de suma cero y de n personas es en realidad una función de n variables; o lo que es igual, es una matriz de n dimensiones. Gran parte del análisis existente en The Theory ofGames and Economíc Behavior se refiere a estas funciones abstractas o matrices, independientemente de si representan tablas de resultados de juegos, decisiones económicas o militares, o cualquier otra cosa. La teoría de juegos se inspiró en los juegos, mas no trata necesariamente sobre ellos.
Los dilemas que aparecen en la vida real retrasaron el futuro desarrollo de la teoría de juegos. Van Neumann al igual que muchos colegas suyos. se apuntó al esfuerzo en pro de la guerra. Esto dejaba poco tiempo para la investigación pura. Von Neumann no volvería a publicar ninguna investigación que abriera camino en matemáticas puras en el período de trabajo a ritmo acelerado de la entreguerra. Paul Halmos escribió en 1973: «El año 1940 marcó la línea divisoria en la carrera científica de Von Neumann; desde entonces. sus comunicaciones científicas y sus publicaciones se interrumpieron. Hasta esa fecha fue un matemático puro de altos vuelos. que además entendía física; a partir de entonces sería un experto en matemáticas aplicadas que recordaba que había trabajado anteriormente en la investigación pura».