Visita Encydia-Wikilingue.con

Dilema del prisionero

dilema del prisionero - Wikilingue - Encydia

Irán a cooperar ambos prisioneros para minimizar la pérdida de la libertad, o uno de los presos, confiando en la cooperación del otro, lo traicionará para ganar la libertad?

El dilema del prisionero es un problema de la teoría de los juegos y un ejemplo claro, pero atípico, de un problema de suma no nula. En este problema, como en otros muchos, se supone que cada jugador, de modo independiente, quiere aumentar al máximo su propia ventaja sin le importar el resultado del otro jugador.

Las técnicas de análisis de la teoría de juegos normalizados - por ejemplo determinar el equilibrio de Nash - pueden llevar cada jugador a escoger traicionar el otro, pero curiosamente ambos jugadores obtendrían un resultado mejor se colaboraran. Infelizmente (para los prisioneros), cada jugador es incentivado individualmente para estafar el otro, aún después de haberle prometido colaborar. Este es el punto-llave del dilema.

En el dilema del prisionero iterado, la cooperación puede obtenerse como un resultado de equilibrio . Aquí se juega repetidamente, pelo que, cuando se repite el juego, se ofrece cada jugador la oportunidad de castigar al otro jugador por la no cooperación en juegos anteriores. Así, el incentivo para estafar puede ser superado por la amenaza del castigo, lo que conduce a un resultado mejor, cooperativo.

El dilema del prisionero fue originalmente formulado por Merrill Flood y Melvin Dresher mientras trabajaban en la RAND en 1950. Más tarde, Albert W. Tucker hizo su formalização con el tema de la pena de prisión y dio al problema general ese nombre específico. El dilema del prisionero (DP) dicho clásico funciona de la siguiente forma:

Dos sospechosos, A y B, son prendidos por la policía. La policía tiene pruebas insuficientes para los condenar, pero, separando los prisioneros, ofrece a ambos el mismo acuerdo: si uno de los prisioneros, confesando, testificar contra el otro y ese otro permanecer en silencio, lo que confesó sale libre mientras el cómplice silencioso cumple 10 años de sentencia. Si ambos queden en silencio, la policía sólo puede condenarlos a 6 meses de cadena cada uno. Si ambos traicionen el comparsa, cada uno lleva 5 años de cadena. Cada prisionero hace su decisión sin saber que decisión el otro va a tomar, y ninguno tiene certeza de la decisión del otro. La cuestión que el dilema propone es: lo que va a acontecer? Como el prisionero va a reaccionar?

El hecho es que puede haber dos vencedores en el juego, siendo esta última solución a mejor para ambos, cuando analizada en conjunto. Sin embargo, los jugadores se confrontan con algunos problemas: Confían en el cómplice y permanecen negando el crimen, aún corriendo el riesgo de ser colocados en una situación aún peor, o confiesan y esperan ser liberados, a pesar de que, si él haga el mismo, ambos quedarán en una situación peor del que se permanecieran callados?

Un experimento basado en el simple dilema encontró que cerca de 40% de participantes cooperaron (i.y., quedaron en silencio).[1]

En abstracto, no importa los valores de las penas, pero el cálculo de las ventajas de una decisión cuyas consecuencias están atreladas a la decisiones de otros agentes, donde la confianza y traición forman parte de la estrategia en juego.

Casos como este son recurrentes en la economía, en la biología y en la estrategia. El estudio de las tácticas más vantajosas en un escenario donde ese dilema se repita es uno de los temas de la teoría de los juegos.

Tabla de contenido

El dilema del prisionero clásico

El enunciado clásico del dilema del prisionero, arriba expuesto, puede resumirse, del punto de vista individual de uno de los prisioneros, en la siguiente tabla (tabla de ganancias):

  Prisionero "B" niega Prisionero "B" delata
Prisionero "A" niega Ambos son condenados a 6 meses "A" es condenado a 10 años; "B" sale libre
Prisionero "A" delata "A" sale libre; "B" es condenada a 10 años Ambos son condenados a 5 años
Archivo:Haftzelle.JPG
El prisionero está ante el dilema de confesar o negar la participación en el crimen, teniendo que lidar con la posibilidad de una dura pena.

Vamos a suponer que ambos prisioneros son completamente egoístas y su única meta es reducir su propia estancia en la prisión. Como prisioneros tienen dos opciones: o cooperar con su cómplice y permanecer callado, o traicionar su cómplice y confesar. El resultado de cada elección depende de la elección del cómplice. Infelizmente, un no sabe lo que el otro escogió hacer. Incluso se pudieran hablar entre sí, no podrían estar seguros de confiar mutuamente.

Si esperarse que el cómplice escoja cooperar con él y permanecer en silencio, la opción óptima para el primero sería confesar, lo que significaría que sería liberado inmediatamente, mientras el cómplice tendrá que cumplir una pena de 10 años. Si espera que su cómplice decida confesar, la mejor opción es confesar también, ya que al menos no recibirá la pena completa de 10 años, y sólo tendrá que esperar 5, tal como el cómplice. Si ambos decidan cooperar y permanezcan en silencio, ambos serán liberados en sólo 6 meses.

Confesar es una estrategia dominante para ambos jugadores. Sea cuál sea la elección del otro jugador, pueden reducir siempre su sentencia confesando. Por desgracia para los prisioneros, esto conduce a un resultado regular, en el cual ambos confiesan y ambos reciben largas condenas. Aquí se encuentra el punto llave del dilema. El resultado de las interacciones individuales produce un resultado que no es óptimo en el sentido de Pareto; existe una situación tal que la utilidad de uno de los detenidos podría mejorar (o aún a de ambos) sin que esto implique una pioria para el resto. Por otras palabras, el resultado en el cual ambos detenidos no confiesan domina el resultado en el cual los dos escogen confesar.

Si pensarse por la perspectiva del interés óptimo del grupo (de los dos prisioneros), el resultado correcto sería que ambos cooperaran, ya que esto reduciría el tiempo total de pena del grupo a un total de un año. Otra decisión sería peor para ambos si considerarse conjuntamente. A pesar de eso, si continuaran en su propio interés egoísta, cada uno de los de los prisioneros recibirá una dura pena.

Si un jugador tenga una oportunidad para castigar el otro jugador al confesar, entonces un resultado cooperativo puede mantenerse. La forma iterada de este juego (mencionada más abajo) ofrece una oportunidad para este tipo de castigo. En ese juego, si el cómplice traiciona y confiesa una vez, se puede castigarlo traicionándolo en la prójima. Así, el juego iterado ofrece una opción de castigo que está ausente en el modo clásico del juego.

Este juego posee como solución del punto de vista Óptimo de Pareto la estrategia:

Este juego posee como Equilibrios de Nash la estrategia:

Un juego similar

El científico cognitivo Douglas Hofstadter (ver las referencias abajo) sugirió una vez que las personas encuentran muchas veces problemas como el dilema del prisionero más fáciles de entender cuando son presentados como un simple juego o intercambio. Uno de los ejemplos que usó fue lo de dos personas que se encuentren e intercambien maletas cerradas, con el acuerdo de que una de ellas contenga dinero y la otra contenga un objeto que está siendo comprado. Cada jugador puede escoger seguir el acuerdo poniendo en su maleta lo que despertó, o puede engañar ofreciendo una maleta vacía. En este juego de intercambio, al contrario del dilema del prisionero, el engaño es siempre a mejor opción.

Matriz de ganancias del dilema del prisionero

En el mismo artículo, Hofstadter también observó que la matriz de ganancias del dilema del prisionero puede, de hecho, tomar múltiples valores, siempre que se adhiera al siguiente principio:

T > R > C > P

donde T es la tentação para traicionar (es decir, lo que se obtiene cuando se deserta y el otro jugador coopera); R es a recompensa por la cooperación mutua; C es el castigo por la deserção mutua; y P es la pagada del ingenuo (es decir, lo que se obtiene cuando un jugador coopera y el otro deserta).

La matriz de ganancias sería:

A, B Niega Confiesa
Niega -1/2, -1/2 -10, 0
Confiesa 0, -10 -5, -5

El dilema del prisionero cumple la fórmula : 0 > -0,5 > -5 > -10 (en negativo por cuanto los números representan años de cárcel).

Acostumbra también cumplirse (T + C)/2 < R, y es decir exigido en el caso iterado[2].

Las fórmulas anteriores aseguran que, independientemente de los números exactos en cada parte de la matriz de ganancias, es siempre "mejor" para cada jugador desertar, haga lo que haga el otro.

Siguiendo este principio, y simplificando el dilema del prisionero al escenario del cambio de maletas anterior (o a un juego de dos jugadores tipo Axelrod — ver más abajo), obtendremos la siguiente matriz de ganancias canónica para el dilema del prisionero, es decir, a que se acostumbra mostrar en la literatura sobre este tema:

  Cooperar Desertar
Cooperar 3, 3 -5, 5
Desertar 5, -5 -1, -1

En terminologia "ganancia-gano" la tabla sería semejante a esta:

  Cooperar Desertar
Cooperar ganancia - ganancia pérdida sustancial- ganancia sustancial
Desertar ganancia sustancial - pérdida sustancial pérdida - pérdida

Ejemplos en la vida real

Estos ejemplos en concreto en que intervienen prisioneros, cambio de maletas y cosas parecidas pueden parecer rebuscados, pero existen, de hecho, muchos ejemplos de interacciones humanas e interacciones naturales en las cuales se obtiene la misma matriz. El dilema del prisionero es sólo por sí de interés para las ciencias sociales, como la economía, la ciencia política y sociología , además de las ciencias biológicas como la etologia y la biología evolutiva.

En ciencia política, por ejemplo, el escenario del dilema del prisionero se usa para ilustrar el problema de los estados envueltos en las carreras a la armas. Ambos concluyeron que tienen dos opciones: o incrementar los gastos militares, o llegar a un acuerdo para reducir su armamento. Ninguno de los dos estados puede estar seguro de que el otro acatará el acuerdo; de este modo, ambos se inclinan para la expansión militar. La ironia está en que ambos estados parecen actuar racionalmente, pero el resultado es completamente irracional.

Otro interesante ejemplo tiene a ver con un concepto conocido de las carreras en el ciclismo, por ejemplo, en la Vuelta a la Francia. Considérense dos ciclistas la mitad de la carrera, con el pelotão la gran distancia. Los dos ciclistas trabajan en cooperación mutua, compartindo la pesada carga de la posición dianteira, donde no se pueden refugiar del viento. Si ninguno de los ciclistas hace un esfuerzo para permanecer adelante, el pelotão los alcanzará rápidamente (deserção mutua). Un ejemplo visto a menudo es que un ciclista hace solo todo su trabajo, manteniendo ambos lejos del pelotão. En el final, esto llevará probablemente a una victoria del segundo ciclista, que tuvo una carrera más fácil gracias el trabajo del primer pasillo.

Por último, la conclusión teórica del dilema del prisionero es la razón por la cual, en muchos países, se prohíben los acuerdos judiciales. Frecuentemente se aplica precisamente el escenario del dilema del prisionero: es del interés de ambos sospechosos o confesar o testificar contra el otro prisionero/sospechoso, aunque ambos sean inocentes del supuesto crimen o actividad ilícita. Se puede decir que el peor caso se da cuando sólo uno de ellos es culpado: no es probable que el inocente confiese, mientras el culpable tenderá a confesar y a testificar contra el inocente.

El dilema del prisionero iterado (DPI)

En su libro La evolución de la cooperación: el dilema del prisionero y la teoría de juegos (1984), Robert Axelrod estudió una extensión al escenario clásico del dilema del prisionero que denominó dilema del prisionero iterado (DPI). Aquí, los participantes deben escoger una y otra vez su estrategia mutua, y tienen memoria de sus encuentros previos. Axelrod invitó compañeros académicos de todo el mundo a concebir estrategias automatizadas para competir en un torneo de DPI. Los programas que participaron variaban ampliamente en la complejidad del algoritmo: hostilidad inicial, capacidad de perdón y similares. Axelrod descubrió que cuando se repiten estos encuentros durante un largo periodo de tiempo con muchos jugadores, cada uno con distinguidas estrategias, las estrategias "egoístas" tendían a ser peores a largo plazo, mientras que las estrategias "altruistas" eran mejores, juzgándolas únicamente con respecto al interés propio. Usó esto para mostrar un posible mecanismo que explicara lo que antes había sido un difícil punto en la teoría de la evolución: como puede evolucionar un comportamiento altruista a partir de mecanismos puramente egoístas en la selección natural?

Se descubrió que la mejor estrategia determinista era a de "ojo por ojo" ("tit sea tat"), que fue desarrollada y presentada en el torneo por Anatol Rapoport. Era el más simple de todos los programas presentados, conteniendo sólo cuatro líneas de BASIC , y fue lo que ganó el concurso. La estrategia consiste simplemente en cooperar en la primera iteración del juego, y tras eso escoja lo que el oponente escogió en la ronda anterior. Una estrategia ligeramente mejor es "Tit sea Tat con capacidad de perdón". Cuando el oponente desierta, en la siguiente ronda se coopera por veces con él con una pequeña probabilidad (del 1% a 5%). Esto permite la recuperación ocasional de quedar concluido en un círculo vicioso de deserções. La probabilidad exacta depende de la alineación de los oponentes. "Tit sea Tat con capacidad de perdón" es la mejor estrategia cuando se introducen problemas de comunicación en el juego. Esto significa que la veces a jugada es transmitida incorrectamente al oponente: se coopera pero el oponente cree que se desertó.

Tit sea Tat funcionaba, según Axelrod, por dos motivos. El primero es que es "amable", es decir, comienza cooperando y sólo deserta como respuesta a la deserção de otro jugador, y así nunca es el responsable por iniciar un ciclo de deserções mutuas. El segundo es que puede ser provocado, al responder siempre lo que hace el otro jugador. Castiga inmediatamente el otro jugador si este deserta, pero igualmente responde adecuadamente se cooperan de nuevo. Este comportamiento claro y directo significa que el otro jugador entiende fácilmente la lógica por detrás de las acciones de Tit sea Tat, y puede por lo tanto encontrar una forma de trabajar con él productivamente. No es una coincidencia que la mayoría de las estrategias que funcionaron peor en el torneo de Axelrod fueran las que no estaban diseñadas para responder a la elecciones de los otros jugadores. Contra ese tipo de jugador, la mejor estrategia es desertar siempre, ya que nunca se puede asegurar haber establecido una cooperación mutua fiable.

Para el DPI, ni siempre es correcto decir que una correcta estrategia es la mejor. Por ejemplo, considérese una población donde todos desertan siempre, excepto un único individuo que continúa la estrategia Tit sea Tat. Este individuo tiene una pequeña desvantagem porque pierde la primera ronda. En una población con uno cierto porcentaje de individuos que desertan siempre y otros que continúan la estrategia Tit sea Tat, la estrategia óptima para un individuo depende del porcentaje, y de la duración del juego. Se realizaron simulaciones de poblaciones, donde mueren los individuos con puntuaciones bajas y se reproducen aquellos con puntuaciones altas. La mezcla de algoritmos en la población final depende de la mezcla en la población inicial.

Si un DPI va a ser iterado exactamente N veces, para alguna constante conocida N, hay otro dato interesante. El equilibrio de Nash es desertar siempre. Esto se prueba fácilmente por inducción: Se puede desertar la última ronda, ya que el oponente no tendrá oportunidad de castigar. Por eso, ambos desertarán en la última ronda. Entonces, se puede desertar la ronda anterior, ya que el oponente desertará en la última hágase lo que se haga. Y se continúa de este modo. Para que la cooperación continúe atractiva, el futuro debe ser indeterminado para ambos jugadores. Una solución consiste en hacer aleatorio el número total de rondas N.

Otro caso especial es "jugar eternamente" el dilema del prisionero. El juego se repite un número infinito de rondas, y la puntuación es la media.

El juego del dilema del prisionero es fundamental para entender ciertas teorías de cooperación y confianza humana. En la suposición de que las transacciones entre dos personas que exijan confianza pueden ser modeladas por el dilema del prisionero, el comportamiento cooperativo en poblaciones puede ser modelado por una versión para varios jugadores e iterada del juego. Por eso ha fascinado muchos estudiosos al largo de los años. Una estimativa no demasiado actualizada (Grofman and Pool, 1975) sitúa el número de artículos dedicados al mismo por encima de los 2.000.

Al analizar las estrategias que consiguieron mejor puntuación, Axelrod estableció varias condiciones necesarias para que una estrategia tuviera éxito:

Amabilidade

La condición más importante es a de que la estrategia debe ser "amable", o sea, no desertar antes que el opositor lo haga. Casi todas las estrategias mejor pontuadas eran amables; de ahí una estrategia puramente egoísta no hará "batota" con el oponente, principalmente por razones puramente utilitárias.

Retaliação

Sin embargo, notó Axelrod, la estrategia vencedora no puede ser optimista ciega. De tarde en tarde tiene que retaliar. Un ejemplo de una estrategia no retaliadora es a de "colaborar siempre". ES una elección muy mala, pues estrategias oportunistas o maldosas irán a explorar esa flaqueza sin piedad.

Perdón

Una calidad de las estrategias vencedoras es que son capaces de perdonar. Aunque retaliem, hacen a cooperar inmediatamente que el opositor no continúe a desertar. Esto evita grandes secuencias de venganzas en círculo vicioso, maximizando los puntos.

No-envidia

La última calidad es no sean envidiosas, o sea, no intenten hacer más puntos que los opositores (imposible para una estrategia "amable", es decir, una estrategia "amable" nunca puede hacer más puntos que el opositor).

Así, Axelrod alcanza la conclusión tal vez utópica de que los individuos egoístas por su propio egoísmo tenderán a ser amables y colaborantes, indulgentes y no envidiosos. Una de las más importantes conclusiones del estudio de Axelrod's en cuanto a este problema es que los individuos "amables" acaban con las mejores clasificaciones.

Sociedades secretas en el dilema del prisionero iterado

En el vigésimo aniversario de la competición del dilema del prisionero iterado (2004), el equipo de la Universidad de Southampton ganó las primeras posiciones, venciendo, entre los demás competidores, algoritmos plantilla tit-sea-tat y sus derivados. La competición era de la variante del dilema del prisionero iterado con problemas de comunicación (es decir, algunas veces no se comunicaban bien los movimientos al otro jugador).

En esa edición se presentaron 223 competidores, de los cuales 60 fueron inscritos por Southampton. Todos eran variantes de un mismo algoritmo, y en las primeras 5 a 10 iteraciones del dilema del prisionero utilizaban sus respuestas como "saudação secreta" para identificarse entre sí. Entonces, se identificaban al otro jugador como pertenecientes a la "sociedad", y algunos algoritmos estaban diseñados para sacrificarse colaborando siempre, de modo que los otros, traicionándolos siempre, pudieran conseguir una puntuación máxima. Si no identificaban el otro algoritmo como perteneciente a la sociedad, después de ver sus jugadas iniciales, todas las variantes lo traicionaban siempre para bajar tanto cuánto posible su puntuación.

Esta estrategia, aunque de discutível correspondencia con el espíritu del juego, ya que requiere una comunicación inicial entre los participantes de la "sociedad" para decidir el formato de la "saudação", se ajusta a la reglas de la competición. siguiéndola, Southampton consiguió que tres de sus participantes ocuparan las tres primeras posiciones, pero a la cuesta de muchos de sus otros algoritmos hayan quedado entre los de peor puntuación.

Psicología del aprendizaje y teoría de los juegos

Cuando los jugadores aprenden a estimar la probabilidad de deserção de los otros, su propio comportamiento es influenciado por su experiencia de ese comportamiento externo. Estadísticas simples muestran que jugadores sin experiencia son más propensos a tener globalmente interacciones invulgarmente buenas o malas con los otros. Si actúan en la base de esas experiencias (desertando o cooperando más del que harían en otros casos) es más probable que sufran en transacciones futuras. Al ganar experiencia se consigue una impresión más verdadera de la probabilidad de deserção y el juego se hace más favorable. Las transacciones iniciales hechas por jugadores inmaduros podrán tener mayor efecto en el juego futuro del que las que lo son por jugadores ya expertos. Este principio explicará porque experiencias formativas de jóvenes son tan influyentes y porque es que estos son particularmente vulnerabais la violencias psicológicas como el bullying, por veces haciéndose ellos propios abusadores.

La probabilidad de traición/deserção en una población puede ser reducida por la experiencia de la cooperación en anteriores juegos permitiendo la construcción de una relación de confianza .[3] De ahí el comportamiento de auto-sacrificio podrá, en algunos casos, aumentar la cohesión moral de un grupo. Si el grupo sea pequeño el comportamiento positivo es más probable de retornar de forma mutua, encorajando los individuos en el grupo para que continúen a cooperar. Estos procesos son preocupaciones de relieve en el estudio del altruísmo recíproco, selección de grupo, selección de parentesco y filosofía moral.

Variantes

Existen algunas variantes del juego, con diferencias sutiles pero importantes en las matrices de ganancias, que se muestran de seguida.

Galinha

Otro importante juego de suma no nula se llama "galinha". En este caso, si tu oponente desierta, te beneficias más se cooperas, y este es el tuyo mejor resultado. La deserção mutua es el peor resultado posible (y por eso un equilibrio inestable), mientras que en el dilema del prisionero el peor resultado posible es la cooperación mientras el otro jugador deserta (así la deserção mutua es un equilibrio estable). En ambos juegos, la "cooperación mutua" es un equilibrio inestable.

Una matriz de ganancias típica sería:

Se llama "galinha" debido al juego de carreras de coches homónimo. Dos jugadores corren uno contra el otro para una aparente colisión frontal: el primero a desviarse de la trayectoria es el galinha. Ambos jugadores evitan el choque (cooperan) o continúan con la trayectoria (desertan). Otro ejemplo es dado cuando dos fazendeiros usan el mismo sistema de irrigação en sus campos. El sistema puede ser mantenido adecuadamente por una persona, pero ambos fazendeiros benefician de eso. Si un fazendeiro no contribuye para su mantenimiento, continúa siendo del interés del otro fazendeiro hacerlo, porque beneficiará haga lo que haga el otro. Así, si un fazendeiro puede establecerse como el desertor dominante — es decir, si su hábito quedar tan enraizado que el otro hace todo el trabajo de mantenimiento — seguramente continuará con ese comportamiento.

Juego de confianza

Un juego de confianza tiene una estructura similar al dilema del prisionero, excepto que a recompensa por la cooperación mutua es mayor que la otorgada por la deserção mutua. Una matriz de victorias típica sería:

El juego de confianza es potencialmente muy estable, ya que da la máxima recompensa a jugadores que establecen un hábito de cooperación mutua. A pesar de esto, existe el problema de que los jugadores no sean conscientes de que está en su interés cooperar. Pueden, por ejemplo, creer incorrectamente que están jugando un juego de dilema del prisionero o galinha, y escoger su estrategia en consonancia con ella.

Amigo o enemigo

"Amigo o enemigo" (Friend or Foe) es un juego emitido en la televisión , en el canal de cabo y satélite estado-unidense Game Show Network. ES un ejemplo del juego del dilema del prisionero probado en personas reales, pero en un ambiente artificial. En el concurso, compiten tres pares de personas. Cuando cada par es eliminado, juegan a un juego del dilema del prisionero para determinar cómo se reparten sus ganancias. Si ambos cooperan ("amigo"), compartem beneficios en 50%. Si uno coopera y el otro deserta ("enemigo"), el desertor lleva todas las ganancias y el cooperador ninguno. Si ambos desertan, nadie lleva nada. Se advierte que la matriz de ganancias es ligeramente diferente del normalizado dato anteriormente, ya que las ganancias de "ambos desertan" y lo de "yo coopero y el otro deserta" son idénticos. Esto hace que "ambos desertan" sea un equilibrio neutral, comparado con el dilema del prisionero normalizado. Si sabes que tu oponente va a votar "enemigo", entonces la elección no afecta las ganancias. De cierto modo, "amigo o enemigo" se encuentra entre el dilema del prisionero y la galinha.

La matriz de ganancias es:

"Amigo o enemigo" es útil para alguien que quiera hacer un análisis del dilema del prisionero aplicado a la vida real. Fíjese en que sólo se puede jugar una vez, siendo que todos los conceptos que implican juegos repetidos no se presentan, y no se puede desarrollar la estrategia de la venganza.

En "amigo o enemigo", cada jugador puede hacer un comentario para convencer el otro en cuanto a su amistad antes de hacer la decisión en secreto de cooperar o desertar. Un posible modo de "ganar al sistema" sería decir al rival: "Voy a escoger 'enemigo'. Si confías en que te dé la mitad de los beneficios después, escoge 'amigo'. De otro modo, iremos ambos aunque sin nada." Una versión más egoísta de esto sería: "Voy a escoger 'enemigo'. Voy a darte X% y quedaré con (100-X)% del premio total. En cuanto (es "coger o largar"), ambos llevamos algo o ninguno de nodos lleva nada."

Ahora el truco está en minimizar X de modo que el otro concurrente continúe escogiendo 'amigo'. Básicamente, se debe saber el umbral en el cual la utilidad (beneficios potenciales) que el opositor gana al vernos a nada reciba ultrapasa la utilidad que él gana en el caso de alinear en el juego cooperativo. Sin embargo, en sus contratos, los jugadores tuvieron que despertar que en el caso en que ambos vencen, nada pueden dar al compañero, o arriesgan el premio entero.

Esta aproximación no fue intentada en el juego: es posible que los jueces no a permitieran.

La "tragedia de los comunes"

La "tragedia de los baldíos" es ilustrada por el problema de los pastos comunitarios, que cuando explorados en exceso significan pérdidas para la comunidad.

La llamada "tragedia de los comunes" (de los pastos comunitarios) es un caso de dilema del prisionero que envuelve muchos agentes y que parece referirse la situaciones reales.

En la formulação que popularizou Garrett Harding, cada vecino de una comunidad campestre prefiere alimentar su gado en pastos comunitarios que en otros propios de peor calidad; si el número de vecinos que satisface esta preferencia superar cierto límite, los pastos comunitarios quedan agotados, y es a esto precisamente que conduce la solución del juego. Para que algún vecino beneficie de los pastos, otros deben pagar el coste de renunciar, o cada uno debe renunciar en parte; pero el equilibrio está en la situación donde cada cuál utiliza los pastos sin preocuparse con los demás.

Traduciendo la situación en el esquema de Hofstadter, cada vecino tiene aquí la tentação T de beneficiar de los pastos sin pagar el coste; a recompensa R por la cooperación mutua consiste en negociar cuántos han-de dejar de beneficiar de los pastos comunitarios para los conservar en buenas condiciones; el castigo C es para todos, cuando cada uno cede a la tentação, y es la ruina de los pastos; la pérdida P es a de que al no aprovecharse de los pastos comunitarios, si permita que otros lo vengan a hacer. Estas posibilidades se combinan como en el dilema del prisionero bipessoal, haciendo que ante el riesgo de recibir P, la pagada del ingenuo, todos cedan a la tentação de no cooperar y provoquen la situación de castigo.

La misma estructura puede aplicarse a cualquier dinámica de esgotamento de recursos por sobre-explotación, y parece estar en el origen de la contaminación ambiental – donde una atmósfera no contaminada podría desempeñar el papel de los pastos comunitarios -, y el automóvil privado el papel del gado-. Se interpretó que evitar soluciones sub-óptimas como estas pasa por la privatización de los bienes de acceso público, limitando en función de la renta el número de personas que pueden caer en la tentação.

Para el filósofo inglés Derek Parfit, son los juegos de muchos agentes, como la "tragedia de los comunes" – y no los juegos bipessoais o los juegos iterados -, los que tienen más interés para estudiar la lógica del dilema del prisionero: por un lado, la situación que los provoca no depende de ganancias diseñadas externamente - por un experimentador o una institución-, pero de la simple competencia de múltiples agentes; por otro, cuantos más sean los participantes, más irracional es abandonar unilateralmente la solución sub-óptima que lleva a C – más improvable son los beneficios de no ceder a la tentação T -, y menos peso tienen las soluciones que se postulam en contextos artificiales de iteración. En suma, el gran número de participantes es para Parfit tanto causa como garantía de que la no cooperación sea una solución estable, y la hace permanente e inevitable (para agentes racionales que busquen satisfacer su propio interés).

Paula Pareja afirma que la capacidad secular de las comunidades indígenas para mantener en buen estado los pastos comunitarios desmiente la inevitabilidade de C, gracias "a la educación, a las costumbres, a los consejos de los anciãos o la otras instituciones sociales". Parece entonces que el dilema se supera gracias a la paradoxal receta que admite Parfit: el propio interés prescribe que, para llegar la soluciones óptimas de Pareto estables, los individuos deben ser educados en teorías morales contrarias a la satisfacción del propio interés.

Bibliografia

Referencias

  1. Tversky, Amos. Preference, Belief, and Similarity: Selected Writings
  2. Dawkins, Richard. The Selfish GenISBN 0-19-286092-5 Página: 204
  3. Este argumento para el desarrollo de la cooperación por la confianza es dado en The Wisdom of Crowds, en que se afirma que el capitalismo para contratos entre locales distantes fue capaz de formarse alrededor de un núcleo de Quakers, que siempre honraron los compromisos comerciales.

Conexiones externas

Your Ad Here