Siempre me fascinó una rama de la matemática llamada teoría de los juegos. Dentro de esa rama hay un famoso paradigma que es el dilema del prisionero. Sin entrar en detalles, la historia es la siguiente: hay dos prisioneros sospechosos de un crimen. El policía les ofrece a los dos por separado confesar.Esto es lo que pasa en cada combinación:
|
Tú lo niegas |
Tú confiesas |
Él lo niega |
Ambos son condenados a 6 meses |
Él es condenado a 10 años; tú sales libre |
Él confiesa |
Él sale libre; tú eres condenado a 10 años |
Ambos son condenados a 6 años. |
Lo más beneficioso para los dos es negar el crimen: los dos salen con una condena de 6 meses. Sin embargo, a mí me conviene siempre confesar: si él no confiesa, en vez de 6 meses salgo libre. Por otro lado, si él confiesa, en vez de 10 años me llevo 6. No importa lo que haga el otro, mi mejor estrategia es confesar, y la de él también. Al final lo que termina pasando en que en vez de llevarnos 6 meses cada uno, nos llevamos 6 años. En la medida en que no haya posibilidad de represalias, la lógica nos lleva a la casilla de abajo a la derecha.
Este ejercicio puede parecer abstracto, pero es muy común. Dos empresas pueden colaborar entre sí manteniendo los precios altos. Si los dos lo hacen, ganan los dos. Si uno de los dos baja los precios, se lleva el mercado y gana mucho. Pero si los dos bajan los precios, pierden los dos. La situación los lleva a no colaborar. De hecho, en la guerra fría se daba lo mismo: si ninguno ataca, estamos bien. Si yo ataco y le destruyo todo, gano yo. Si los dos atacamos, perdemos los dos. La doctrina MAD (mutually assured destruction) apuntaba a modificar la matriz y convertirla en algo diferente al dilema del prisionero.
Todo cambia si el juego se repite en el tiempo. Si el juego se repite, la teoría deja de ser tan sencilla. Hasta que punto me conviene colaborar? Recuerden que si logro «cagar» al otro, es decir, que él colabore y yo no, el premio es muy grande. Como la estrategia ideal no es tan clara, a alguien se le ocurrió (hace unos cuantos años) hacer torneos. Cada participante arma una estrategia, y la plasma en un programa de computadora. Por ejemplo, una estrategia puede ser: «empiezo colaborando, y a partir de la vuelta número 10 dejo de hacerlo» o «colaboro siempre» o «colaboro solo en las rondas pares»
La computadora aparea a los participantes y los hace jugar uno contra el otro. Todos juegan contra todos, y al final el que tiene más puntos gana.
Lo más interesante de la historia es que la estrategia ganadora es indefectiblemente una variación de tit-for-tat, la estrategia más simple de todas: hago lo que me hicieron. Empiezo colaborando. Si en una ronda el otro colaboró, yo sigo colaborando. Si el otro me cagó en la ronda anterior, lo cago en esta. Por ejemplo, un resultado puede ser así
El otro: C C N N C C N N
Tit for tat: C C C N N C C N
Por definición, Tit-for-Tat nunca le gana a nadie, en el mejor de los casos empata: la única manera de aventajear al otro es agarrarlo desprevenido: atacarlo cuando el está colaborando. Y Tit-for-tat nunca lo hace.
Y acá llego finalmente al tema del post: Suena muy poco intuitivo: una estrategia que por definición nunca gana es la ganadora del torneo. Como puede ser? El tema es que los demás, interesados en aventajar al oponente, terminan en una permanente guerra donde a la larga se perjudican más a ellos mismos que a los demás. Lo vemos en todos lados. Por ejemplo, comerciantes que se creen vivos tratando de aventajar a sus clientes o proveedores, y que a menudo lo logran, pero que a la larga se perjudican porque los clientes y proveedores les devuelven el favor.
Yo lo considero una lección de vida que nos da la matemática: ser bondadoso pero castigar las maldades de los demás es a la larga la mejor estrategia.
Read Full Post »