domingo, 10 de mayo de 2015

Avances en la cooperación desde el punto de vista de la Teoría de Juegos

Teoría de Juegos pone a la cooperación en tela de juicio
Una solución reciente para el dilema del prisionero, un escenario clásico de la teoría de juegos, ha creado nuevos rompecabezas en la biología evolutiva.


Un mono vervet  grita una alarma cuando un depredador está cerca, poniéndose en peligro.
Matt Jenner

Por: Emily Singer - Quanta Magazine


Cuando el manuscrito pasó por su escritorio, Joshua Plotkin, un biólogo teórico de la Universidad de Pennsylvania, fue inmediatamente intrigado. El físico Freeman Dyson y el informático William Press, ambos muy logrado en sus campos, habían encontrado una nueva solución a un famoso, con décadas de antigüedad escenario teoría juego llamado el dilema del prisionero, en el que los jugadores deben decidir si hacer trampa o cooperan con un socio. El dilema del prisionero se ha utilizado para ayudar a explicar cómo la cooperación podría soportar en la naturaleza. Después de todo, la selección natural se rige por la ley del más fuerte, por lo que uno podría esperar que las estrategias egoístas se benefician al individuo sería más probable que persista. Pero un estudio cuidadoso del dilema del prisionero reveló que los organismos podrían actuar en su totalidad en su propio interés y poder crear una comunidad cooperativa.

La nueva solución de Press y Dyson al problema, sin embargo, arrojaron que la perspectiva optimista en tela de juicio. Sugirió las mejores estrategias eran los egoístas que llevaron a la extorsión, no cooperación.

Plotkin encontró matemáticas del dúo notable por su elegancia. Pero el resultado le atormentaba. Naturaleza incluye numerosos ejemplos de comportamiento cooperativo. Por ejemplo, los murciélagos vampiro donan parte de su comida de sangre de miembros de la comunidad que no logran encontrar presas. Algunas especies de aves e insectos sociales rutinariamente ayudan a elevar la cría de otra. Incluso las bacterias pueden cooperar, se adhieran entre sí de modo que algunos pueden sobrevivir al veneno. Si reina la extorsión, lo que impulsa a estos y otros actos de altruismo?

Joshua Plotkin ha aplicado el dilema del prisionero
a las poblaciones en evolución.

El trabajo de Press y Dyson miraron a un clásico escenario de la teoría de juegos - un par de jugadores que participan en la confrontación repetida. Plotkin quería saber si generosidad podría resucitar si las mismas matemáticas se aplicó a una situación que se parecía más a la naturaleza. Así que la refundición de su enfoque en una población, permitiendo que los individuos desempeñan una serie de juegos con todos los demás miembros de su grupo. El resultado de sus experimentos, el más reciente de los cuales fue publicado en diciembre en las Actas de la Academia Nacional de Ciencias, sugiere que la generosidad y el egoísmo a pie una línea precaria. En algunos casos, los triunfos de cooperación. Pero cambiar una sola variable, y la extorsión se hace cargo una vez más. "Ahora tenemos una explicación muy general para cuando se espera que la cooperación, o no se espera, evolucionando en las poblaciones", dijo Plotkin, quien condujo la investigación junto con su colega Alexander Stewart.

El trabajo es totalmente teórica en este momento. Pero los resultados podrían potencialmente tener implicaciones de amplio alcance, la explicación de fenómenos que van desde la cooperación entre los organismos complejos a la evolución de pluricelularidad - una forma de cooperación entre las células individuales.

Plotkin y otros dicen que de Prensa y la obra de Dyson podrían proporcionar un nuevo marco para el estudio de la evolución de la cooperación mediante la teoría de juegos, lo que permite a los investigadores a desentrañar los parámetros que permiten la cooperación de existir. "Básicamente ha revivido este campo", dijo Martin Nowak, biólogo y matemático de la Universidad de Harvard.

Ojo por ojo

Los monos vervets son conocidos por sus llamadas de alarma. Un mono gritará para advertir a sus vecinos cuando un depredador está cerca. Pero al hacerlo, llama la atención peligroso para sí mismo. Los científicos que se remontan a Darwin han tenido dificultades para explicar cómo este tipo de comportamiento altruista evolucionó. Si un alto porcentaje suficiente de monos gritando se interceptado por los depredadores, se esperaría que la selección natural para apagar los gritones en el acervo genético. Sin embargo, no es así, y la especulación de por qué ha llevado a décadas de (a veces caldeado) debate.

Los investigadores han propuesto diferentes mecanismos posibles para explicar la cooperación. La selección de parentesco sugiere que ayudar a los miembros de la familia en última instancia, ayuda al individuo. La selección de grupo propone que los grupos cooperativos pueden ser más probabilidades de sobrevivir que los que no cooperan. Y reciprocidad directa postula que los individuos se benefician de ayudar a alguien que les ha ayudado en el pasado.

El dilema del prisionero ayuda a los investigadores a entender las estrategias simples, tales como la cooperación con miembros de la comunidad generosas y engañar a los tramposos, que pueden crear una sociedad cooperativa en las condiciones adecuadas. Descrita por primera vez en la década de 1950, el dilema del prisionero clásico implica un par de delincuentes que sean capturadas y colocadas en habitaciones separadas. Cada uno se da una elección: confesar o permanecer en silencio. En el mejor resultado, ambos dicen nada y ir libres. Pero ya que ni sabe lo que el otro va a hacer, guardar silencio es arriesgado. Si uno soplones y el otro se queda en silencio, la rata recibe una sentencia más leve mientras que el socio silencioso sufre.


Olena Shmahalo / Quanta Magazine

Incluso los organismos simples, como microbios, se involucran en este tipo de juegos. Algunos microorganismos marinos producen moléculas que ayudan a los recogen hierro, un nutriente vital. Colonias microbianas a menudo tienen los productores y los tramposos - microbios que no tienen el compuesto a sí mismos, pero se aprovechan de las moléculas de sus vecinos.
En un solo caso del dilema del prisionero, la mejor estrategia es la de defecto - delatar a su pareja y tendrás menos tiempo. Pero si el juego se repite una y otra vez, la estrategia óptima cambia. En un solo encuentro, un mono verde que ve a un depredador es más seguro si se queda en silencio. Pero a lo largo de toda la vida, el mono es más probabilidades de sobrevivir si se advierte a sus vecinos de peligro inminente y ellos hacen lo mismo. "Cada jugador tiene el incentivo para desertar, pero en general lo hará mejor si cooperan", dijo Plotkin. "Es un clásico problema de cómo puede surgir la cooperación."

En la década de 1970, Robert Axelrod, un politólogo de la Universidad de Michigan, puso en marcha un torneo round-robin enfrentando a diferentes estrategias de unos contra otros. Para sorpresa de muchos contendientes, el enfoque más simple ganó. Simplemente imitando movimiento anterior del otro jugador, una estrategia llamada ojo por ojo, triunfó sobre los programas mucho más sofisticados.

Estrategias de ojo por ojo se pueden encontrar en todo el mundo biológico. Pares de los peces espinosos, por ejemplo, los depredadores cercanos exploradoras en una especie de dueto ojo por ojo. Si un pez hace que el movimiento arriesgado de lanzándose hacia adelante, el otro responda con un acto similar de valentía. Si uno se queda atrás, con la esperanza de dejar que su pareja tome el riesgo, la pareja también cae de nuevo.

En los últimos 30 años, los científicos han explorado versiones realistas más evolutivamente de dilema del prisionero que la simple versión de Axelrod. Jugadores en un gran torneo de todos contra todos comienzan con un conjunto variado de estrategias - Piense en esto como su aptitud determinada genéticamente. Para imitar la supervivencia del más apto, el ganador de cada interacción engendra más descendencia, que hereda la misma estrategia que sus padres. Así, las estrategias más exitosas crecen en popularidad con el tiempo.

El enfoque ganador depende de una variedad de factores, incluyendo el tamaño del grupo, que las estrategias están presentes en la salida, y con qué frecuencia los jugadores cometen errores. De hecho, la adición de ruido para el juego - un cambio aleatorio en la estrategia que actúa como un sustituto de la mutación genética - termina el reinado de ojo por ojo. En estas circunstancias, una variante conocida como generoso ojo por ojo, lo que implica en ocasiones perdonar la traición de otro, triunfos.

El sabor general de estas simulaciones es optimista - amabilidad paga. "Las estrategias más exitosas a menudo tienden a ser los que no tratan de aprovecharse de otra persona", dijo Nowak.

Introduzca Prensa y Dyson con una dosis oscuro de la desesperación.

Triunfo del Cooperador

A pesar de sus hojas de vida impresionantes, tanto de Press y Dyson eran relativamente nuevos en la teoría de juegos. Eso hizo que su nueva solución al dilema de los 60 años de edad, preso, publicado en las Actas de la Academia Nacional de Ciencias en 2012, aún más inesperado. "Es un papel notable que bien podría haber sido escrito hace 30 años", dijo Plotkin. "La idea matemática en el corazón de su papel se pasó por alto, a pesar de cientos de científicos que estudian la teoría de juegos y sus aplicaciones."

Estrategias de supervivenciaCómo la teoría de juegos reconcilia la evolución con la cooperaciónEn el dilema del prisionero iterado, dos jugadores compiten unos contra otros en una serie de rondas. Luego, los investigadores pueden determinar qué estrategia es la más exitosa en el largo plazo. A continuación, el jugador de la columna izquierda emplea una estrategia generosa, tratando de atraer a su oponente en ayudar por ayudar a veces incluso cuando los defectos oponente. El jugador egoísta a la derecha tiende a desertar, sólo ayudando con la suficiente frecuencia para evitar su oponente de deserción permanente. Cada ronda se anotó mediante el uso de una matriz como el ejemplo bate arriba:
Olena Shmahalo / Quanta Magazine
En un partido de cabeza a cabeza, la estrategia egoísta derrota al generoso. Sin embargo, las mismas estrategias tienen diferentes resultados cuando se aplica a un escenario más realista evolutivamente. En el vídeo a continuación, una población de jugadores se involucra en una serie de cabeza a cabeza se encuentra con mucho a un torneo de todos contra todos. El jugador que "gana" cada encuentro engendra más descendencia que emplean estrategias similares. En este caso, un solo jugador que emplea una estrategia generosa tenderá a difundir su estrategia a través de la población:

En última instancia toda la población se convierte de egoísta a las estrategias generosas. Los biólogos utilizan modelos como este para explicar cómo cooperativa comportamiento persiste en la naturaleza.


Press y Dyson esbozan un enfoque, la extorsión apodado, en el que un jugador siempre puede ganar al optar por desertar de acuerdo con un conjunto prescrito de probabilidades. La estrategia de Press y Dyson es notable, ya que permite a un jugador para controlar el resultado del juego. "La principal innovación consiste en calcular la frecuencia con la que usted puede desertar sin desmotivar a su co-jugador completo", dijo Christian Hilbe, investigador en el grupo de Nowak en Harvard. Por otra parte, el jugador ganador sólo necesita recordar una jugada anterior, pero la estrategia funciona igual de bien que los que incorporan muchas rondas anteriores de juego.

El segundo jugador se ve obligado a cooperar con el extorsionista porque esa es la opción que ofrece la mejor recompensa. "Si soy un extorsionista, de vez en cuando voy a desertar a pesar de que hemos colaborado, en proporción suficiente precisión que no importa lo que haga, voy a tener una ganancia mayor que tú", dijo Plotkin. La situación es una reminiscencia de un proyecto de grupo en la escuela secundaria. Si uno de los miembros de los pantalones del equipo apagado, los estudiantes de conciencia no tienen más remedio que trabajar más duro para ganar una buena calificación.

Press y de Dyson documento original se creó en un contexto teoría clásica de juegos - una serie de interacciones entre un solo par de jugadores. Pero Plotkin y Stewart querían saber lo que sucedería si se aplican el mismo enfoque matemático a un grupo en constante evolución, como los monos verdes o murciélagos vampiros, que se reproducen y sobreviven basados ​​en su aptitud individual. Ellos exploraron la clase más amplia de estrategias exitosas, llamadas estrategias de cero determinantes, que presionado Dyson habían identificado.

Esta clase de estrategias incluye todo lo contrario moral de la extorsión: la generosidad. En general, un jugador que emplea una estrategia generosa siempre cooperará cuando su oponente hace. Si los defectos oponente, el primer jugador que va a cooperar con una cierta probabilidad en un intento de convencer al oponente de nuevo a la generosidad.

Para alivio Plotkin y de Stewart, estrategias generosos en vez de las extorsivos tuvieron más éxito cuando se aplica a poblaciones en evolución. "Encontramos un panorama mucho más optimista", dijo Plotkin, que publicó los resultados en 2013 en las Actas de la Academia Nacional de Ciencias. "Las estrategias más sólidas, las que no pueden ser reemplazados por otras estrategias, son generosos."

La intuición básica es simple. "Extorsión hace bien con un oponente", dijo Plotkin. "Pero en una población grande, ladrón finalmente emparejarse con otro ladrón." Entonces ambos desertar, para conseguir una recompensa más pobre. "Plotkin mejorar nuestro modelo girando al revés", dijo Dyson. "Si quieres a alguien a cooperar con usted, es mejor para sobornar a la persona con beneficios de corto alcance que castigarla de inmediato."

Hilbe confirmó estos hallazgos en un escenario del mundo real, enfrentando a jugadores humanos contra equipos con estrategias bien generosas o extorsionistas. Como se predijo, la gente ganó pagos más grandes cuando se juega contra equipos generosas que contra los egoístas. Pero la gente también tiende a castigar a los opositores de extorsión, negándose a cooperar a pesar de que sería en su mejor interés para hacerlo. Esto a su vez reduce la recompensa por tanto jugador humano y el ordenador. Al final, el equipo generoso ganó un premio más grande que el equipo extorsionista.

La venganza del extorsionista

Teniendo en cuenta estos resultados, Plotkin espera extorsionadores podrían mantenerse a raya. Pero ese optimismo duró poco. Después de su estudio de 2013, Plotkin cambió las rentabilidades que se pueden ganar por cooperar o no. Los jugadores pasaron tanto su estrategia y los beneficios estratégicos a su descendencia; ambas cantidades pueden sufrir mutaciones aleatorias.

 Con esta reorganización al sistema, lo que podría corresponder a un cambio en las condiciones ambientales, el resultado volvió al lado oscuro. Generosidad ya no era la solución preferida. "A medida que las mutaciones que aumentan la tentación de desertar de barrido a través del grupo, la población llega a un punto de inflexión", dijo Plotkin. "La tentación de desertar es abrumadora, y la deserción gobierna el día."

Plotkin dijo que el resultado fue inesperado. "Es sorprendente porque es dentro del mismo marco - la teoría de juegos - que la gente ha utilizado para explicar la cooperación", dijo. "Pensé que incluso si usted permite el juego de evolucionar, la cooperación todavía prevalecería."

La lección es que los pequeños ajustes a las condiciones pueden tener un efecto importante sobre si la cooperación o extorsión triunfos. "Es muy agradable ver que esto lleva a cualitativamente diferentes resultados", dijo Jeff Gore, un biofísico en el Instituto de Tecnología de Massachusetts, quien no participó en el estudio. "En función de las limitaciones, puede evolucionar cualitativamente diferentes tipos de juegos."

Chris Adami, biólogo computacional en la Universidad Estatal de Michigan, sostiene que no hay tal cosa como una estrategia óptima - el ganador depende de las condiciones.

 De hecho, es poco probable que sea el final de la historia del estudio de Plotkin. "Estoy seguro de que habrá gente que mira cómo el resultado depende de los supuestos", dijo Hilbe. "Tal vez la cooperación de alguna manera puede ser rescatado."

Futuro del prisionero

El dilema del prisionero es, obviamente, una versión muy simplificada de las interacciones reales.

Así que lo bueno que un modelo es que para el estudio de la evolución de la cooperación? Dyson no es optimista. Le gustan los estudios de Plotkin y Hilbe de, pero sobre todo porque implican las matemáticas interesantes. "Ciertamente como una descripción de los mundos posibles es muy interesante, pero no se ve a mí como el mundo de la biología", dijo Dyson.

Ethan Akin, un matemático que ha explorado estrategias similares para Prensa y Dyson, dijo que cree que los resultados son más aplicables a la toma de decisiones sociológica que a la evolución de la cooperación.

Pero algunos biólogos experimentales no están de acuerdo, diciendo que tanto el dilema del prisionero y la teoría de los juegos más ampliamente han tenido un efecto profundo en su campo. "Creo que la contribución de la teoría de juegos a la cooperación microbiana es enorme", dijo Will Ratcliff, un biólogo evolutivo en el Instituto de Tecnología de Georgia.

Por ejemplo, los científicos que estudian la resistencia a los antibióticos están utilizando un escenario de la teoría de juegos llamado el juego de la nieve acumulada, en el que un jugador siempre se beneficia de cooperar. (Si está atrapado en su edificio de apartamentos después de una tormenta de nieve, se beneficiará por palear el camino de entrada, pero lo mismo ocurre con todos los demás que vive allí y no tienen una pala.) Algunas bacterias pueden producir y secretar una enzima capaz de desactivar los antibióticos. La enzima es costoso de producir, y las bacterias perezosos que no lo hacen pueden beneficiarse mediante el uso de enzimas producidas por sus vecinos más industriosa. En el escenario del dilema del prisionero estricta, los holgazanes eventualmente matar a los productores, perjudicando a toda la población. Pero en el juego ventisquero, los productores tienen un mayor acceso a la enzima, lo que mejora su condición física, y los dos tipos de bacterias pueden coexistir.

Los microbios en el laboratorio pueden imitar los escenarios de la teoría de juegos, pero si estos ambientes controlados reflejan con exactitud lo que está pasando en la naturaleza es otra historia. "Nos pusimos en la dinámica del juego, asumiendo un cierto tipo de la ecología", dijo Ratcliff. Pero esos parámetros podrían no reflejar hábitat normal del microbio. "Para mostrar que la dinámica de un experimento se ajustan al dilema del prisionero u otros juegos no necesariamente significan esos mecanismos a unidad en la naturaleza", dijo Ratcliff.

No hay comentarios:

Publicar un comentario