Mostrando entradas con la etiqueta teoría de juegos. Mostrar todas las entradas
Mostrando entradas con la etiqueta teoría de juegos. Mostrar todas las entradas

jueves, 25 de octubre de 2018

Puede tomar todo el tiempo del Universo encontrar un equilibrio de Nash

En la teoría de juegos, no hay un camino claro hacia el equilibrio

La noción de equilibrio de John Nash es omnipresente en la teoría económica, pero un nuevo estudio muestra que a menudo es imposible llegar de manera eficiente.


Laberinto de equilibrio de Nash

Todos los juegos tienen un equilibrio de Nash. ¿Pero los jugadores podrán alcanzarlo?

Erica Klarreich |Corresponsal contribuyente
Quanta Magazine



En 1950, John Nash, el matemático que luego apareció en el libro y la película "A Beautiful Mind", escribió un artículo de dos páginas que transformó la teoría de la economía. Su idea crucial, pero completamente simple, era que cualquier juego competitivo tiene una noción de equilibrio: una colección de estrategias, una para cada jugador, de modo que ningún jugador pueda ganar más al cambiar unilateralmente a una estrategia diferente.

El concepto de equilibrio de Nash, que le valió el Premio Nobel de economía en 1994, ofrece un marco unificado para comprender el comportamiento estratégico no solo en economía, sino también en psicología, biología evolutiva y muchos otros campos. Su influencia en la teoría económica "es comparable a la del descubrimiento de la doble hélice del ADN en las ciencias biológicas", escribió Roger Myerson, de la Universidad de Chicago, otro Nobel de economía.

Cuando los jugadores están en equilibrio, nadie tiene una razón para desviarse. Pero, ¿cómo llegan los jugadores al equilibrio en primer lugar? En contraste con, digamos, una bola que rueda cuesta abajo y se detiene en un valle, no hay una fuerza obvia que guíe a los jugadores del juego hacia un equilibrio de Nash.


El trabajo de John Nash en teoría de juegos transformó la economía.


"Siempre ha sido una espina para los microeconomistas", dijo Tim Roughgarden, un científico informático teórico en la Universidad de Stanford. "Usan estos conceptos de equilibrio, y los están analizando como si las personas estuvieran en equilibrio, pero no siempre hay una explicación satisfactoria de por qué las personas estarán en equilibrio de Nash en lugar de simplemente buscar a tientas por uno".

Si las personas juegan solo una vez, a menudo no es razonable esperar que encuentren un equilibrio. Este es especialmente el caso si, como es típico en el mundo real, cada jugador sabe solo cuánto ella misma valora los diferentes resultados del juego, y no cuánto lo hacen sus compañeros. Pero si las personas pueden jugar repetidamente, tal vez podrían aprender de las primeras rondas y dirigirse rápidamente hacia un equilibrio. Sin embargo, los intentos por encontrar métodos de aprendizaje tan eficientes siempre han resultado secos.

"Los economistas han propuesto mecanismos para que puedas converger [rápidamente] al equilibrio", dijo Aviad Rubinstein, quien está terminando un doctorado en informática teórica en la Universidad de California en Berkeley. Pero para cada uno de esos mecanismos, dijo, "hay juegos simples que puedes construir donde no funcionan".
59: 12/14: 43

Ahora, Rubinstein y Yakov Babichenko, matemático del Instituto de Tecnología Technion-Israel en Haifa, han explicado por qué. En un artículo publicado en línea en septiembre pasado, demostraron que ningún método de adaptación de estrategias en respuesta a juegos anteriores, no importa cuán cómodos, creativos o inteligentes, converjan de manera eficiente incluso en un equilibrio de Nash aproximado para cada juego posible. Es "un resultado negativo muy arrollador", dijo Roughgarden.

Los economistas a menudo usan los análisis de equilibrio de Nash para justificar las reformas económicas propuestas, dijo Myerson. Pero el nuevo resultado dice que los economistas no pueden suponer que los jugadores del juego llegarán a un equilibrio de Nash, a menos que puedan justificar lo que es especial sobre el juego en cuestión. "Si está tratando de averiguar si su juego encontrará fácilmente un equilibrio", dijo Noam Nisan, un científico informático de la Universidad Hebrea, "depende de usted proporcionar el argumento de por qué sería".
Juegos multijugador

En algunos juegos simples, es fácil detectar los equilibrios de Nash. Por ejemplo, si prefiero la comida china y usted prefiere la italiana, pero nuestra preferencia más fuerte es cenar juntos, hay dos equilibrios obvios para que ambos vayamos al restaurante chino o los dos vayamos al restaurante italiano. Incluso si comenzamos a conocer solo nuestras preferencias y no podemos comunicar nuestras estrategias antes del juego, no tomará demasiadas rondas de conexiones perdidas y cenas solitarias antes de que entendamos las preferencias de los demás y, con suerte, encontremos nuestro camino. a uno u otro equilibrio.

Pero imagínese si los planes de la cena incluyeran a 100 personas, cada una de las cuales ha decidido preferencias sobre con qué otras personas le gustaría cenar y ninguna de las cuales conoce las preferencias de otra persona. Nash demostró en 1950 que incluso los juegos grandes y complicados como este siempre tienen un equilibrio (al menos, si se amplía el concepto de una estrategia para permitir elecciones al azar, como elegir el restaurante chino con un 60% de probabilidad). Pero Nash, quien murió en un accidente automovilístico en 2015, no dio ninguna receta sobre cómo calcular ese equilibrio.

Aviad Rubinstein ayudó a demostrar que los jugadores del juego no necesariamente encontrarán un equilibrio de Nash.

Al sumergirse en el meollo de la prueba de Nash, Babichenko y Rubinstein pudieron demostrar que, en general, no hay un método garantizado para que los jugadores encuentren un equilibrio de Nash aproximado a menos que se digan prácticamente todo sobre sus preferencias respectivas. Y a medida que aumenta el número de jugadores en un juego, la cantidad de tiempo requerido para toda esta comunicación se vuelve rápidamente prohibitiva.

Por ejemplo, en el juego de restaurante para 100 jugadores, hay 2100 formas en que el juego podría jugarse, y por lo tanto, 2100 preferencias que cada jugador tiene que compartir. En comparación, la cantidad de segundos que han transcurrido desde el Big Bang es solo de unos 259.

Este cuello de botella en la comunicación significa que todos los métodos posibles para adaptar estrategias de una ronda a otra no servirán para guiar a los jugadores de manera eficiente hacia un equilibrio de Nash en al menos algunos juegos complejos (como un juego de restaurante para 100 jugadores con preferencias complicadas). Después de todo, en cada ronda, los jugadores aprenden solo un poco de información nueva sobre los demás: qué contentos están con el arreglo de cena individual que se jugó. Así que tomará el orden de las 2100 rondas antes de que sepan todo sobre los valores de los demás (para cuando, presumiblemente, los restaurantes chinos e italianos habrán cerrado).

"Si esto va a llevar más tiempo que la edad del universo", dijo Sergiu Hart, un teórico del juego en la Universidad Hebrea de Jerusalén, "es completamente inútil, por supuesto".

Puede parecer natural, casi obvio, que los jugadores a veces necesitarán saber todo sobre los valores de los demás para encontrar un equilibrio de Nash. El nuevo documento muestra, sin embargo, que esta misma limitación se mantiene incluso si los jugadores están dispuestos a conformarse con un equilibrio de Nash aproximado: un hallazgo importante cuando se trata de aplicaciones del mundo real, en las que se obtiene un resultado cercano al equilibrio de Nash. a menudo lo suficientemente bueno

Yakov Babichenko ayudó a demostrar que alcanzar un equilibrio de Nash podría llevar más tiempo que la edad del universo.

El resultado de Babichenko y Rubinstein no implica que todos los juegos, o incluso la mayoría, estén sujetos a esta limitación, solo que algunos juegos sí lo harán. Muchos de los juegos que usan los economistas para modelar el mundo real tienen una estructura adicional que reduce considerablemente la cantidad de información que cada jugador debe comunicar. Por ejemplo, si 100 de nosotros elegimos una de las dos rutas para nuestro viaje por la mañana, es probable que no te importe qué jugadores van en cada ruta, solo te importa cuántas personas van. Eso significa que su colección de preferencias tendrá un alto grado de simetría, y potencialmente puede transmitir su totalidad en un par de oraciones bien elegidas en lugar de 2100 de ellas.

Los economistas podrían usar tales argumentos para justificar por qué el equilibrio de Nash podría alcanzarse para juegos particulares. Pero el nuevo resultado implica que tales justificaciones deben hacerse caso por caso; no hay un argumento de muerte que cubra todos los juegos todo el tiempo.

Además, a pesar de que muchos juegos que han evolucionado junto con la civilización pueden ser susceptibles a tales simplificaciones, la era de Internet está dando lugar a todo tipo de juegos nuevos para múltiples jugadores, desde sitios de citas hasta transacciones de acciones en línea. "En este punto, no tenemos la lenta evolución de la humanidad que solo nos guía hacia juegos donde es fácil encontrar un equilibrio", dijo Nisan. "Diseñamos juegos nuevos, y si suponemos que vamos a lograr un equilibrio, muy a menudo nos vamos a equivocar".

En la vida real, las personas a menudo no juegan juegos de equilibrio, algo que los economistas conocen muy bien, dijo Andrew McLennan, economista de la Universidad de Queensland en Brisbane, Australia. Pero, dijo, "la economía no tiene ninguna estructura teórica para preguntar qué tan precisa puede ser la economía". Los resultados teóricos de la informática, como el nuevo de Babichenko y Rubinstein, "deberían ser una inspiración para abordar el problema de manera formal" él dijo.

Pero los dos campos tienen una mentalidad muy diferente, lo que puede obstaculizar la comunicación interdisciplinaria: los economistas tienden a buscar modelos simples que capten la esencia de una interacción compleja, mientras que los científicos de la computación teórica suelen estar más interesados ​​en comprender qué sucede a medida que los modelos se vuelven cada vez más complejos. "Desearía que mis colegas en economía estuvieran más conscientes, más interesados ​​en lo que está haciendo la informática", dijo McLennan.
Un asesor de confianza

El nuevo trabajo traza una brillante línea divisoria entre el equilibrio de Nash y otro concepto de equilibrio más general que se destacó 24 años después del artículo de Nash. "Equilibrio correlacionado", propuesto en 1974 por Robert Aumann, otro Nobel de economía, plantea un escenario en el que los jugadores reciben consejos de un mediador confiable (o "dispositivo de correlación") sobre qué estrategia jugar. El consejo del mediador forma un equilibrio correlacionado si ningún jugador individual tiene un incentivo para desviarse del consejo que ha recibido, si cree que los otros jugadores están siguiendo cada uno su propio consejo.

Esto puede sonar al principio como una construcción arcana, pero en realidad usamos equilibrios correlacionados todo el tiempo, cuando, por ejemplo, dejamos que un sorteo de monedas decida si saldremos para chino o italiano, o permitiremos que un semáforo dicte Cuál de nosotros pasará primero por una intersección.
Robert Aumann inventó el concepto de equilibrio correlacionado.
En estos dos ejemplos, cada jugador sabe exactamente qué consejo le da el "mediador" al otro jugador, y el consejo del mediador esencialmente ayuda a los jugadores a coordinar qué equilibrio de Nash jugarán. Pero cuando los jugadores no saben exactamente qué consejos están recibiendo los demás, solo cómo los diferentes tipos de consejos se correlacionan entre sí, Aumann demostró que el conjunto de equilibrios correlacionados puede contener más que solo combinaciones de equilibrios de Nash: puede incluir formas de juego que no son en absoluto los equilibrios de Nash, pero que a veces resultan en un resultado social más positivo que cualquiera de los equilibrios de Nash. Por ejemplo, en algunos juegos en los que cooperar rendiría un beneficio total más alto para los jugadores que actuar de manera egoísta, el mediador a veces puede engañar a los jugadores para que cooperen ocultando el consejo que les da a los otros jugadores. Este hallazgo, dijo Myerson, fue "un rayo del azul".

Y aunque un mediador puede dar muchos tipos diferentes de consejos, el conjunto de equilibrios correlacionados de un juego, que está representado por una colección de ecuaciones lineales y desigualdades, es matemáticamente más manejable que el conjunto de equilibrios de Nash. "Esta otra forma de pensar sobre esto, las matemáticas es mucho más hermosa", dijo Myerson.

Si bien Myerson ha calificado la visión de la teoría de juegos de Nash como "uno de los avances intelectuales más destacados del siglo XX", considera que el equilibrio correlacionado es quizás un concepto aún más natural que el equilibrio de Nash. Ha opinado en numerosas ocasiones que "si hubiera vida inteligente en otros planetas, en la mayoría de ellos habrían descubierto el equilibrio correlacionado antes del equilibrio de Nash".

Cuando se trata de repetidas rondas de juego, muchas de las formas más naturales que los jugadores pueden elegir para adaptar sus estrategias convergen, en un sentido particular, a los equilibrios correlacionados. Tomemos, por ejemplo, los enfoques de "minimización de arrepentimiento", en los cuales, antes de cada ronda, los jugadores aumentan la probabilidad de usar una estrategia determinada si se arrepienten de no haber jugado más en el pasado. La minimización por arrepentimiento es un método "que tiene cierta semejanza con la vida real: prestar atención a lo que funcionó bien en el pasado, combinado con experimentar un poco ocasionalmente", dijo Roughgarden.

Para muchos enfoques que minimizan el arrepentimiento, los investigadores han demostrado que el juego convergerá rápidamente a un equilibrio correlacionado en el siguiente sentido sorprendente: después de que tal vez se hayan jugado 100 rondas, el historial del juego se verá esencialmente igual que si un mediador hubiera estado aconsejando a los jugadores todo el tiempo. Es como si "el dispositivo [correlativo] se encontrara implícitamente de alguna manera, a través de la interacción", dijo Constantinos Daskalakis, un científico informático teórico del Instituto de Tecnología de Massachusetts.

A medida que el juego continúa, los jugadores no se mantendrán necesariamente en el mismo equilibrio correlacionado; después de 1,000 rondas, por ejemplo, pueden haberse desplazado a un nuevo equilibrio, de modo que ahora su historial de 1,000 juegos parece haber sido guiado por un Mediador diferente al anterior. El proceso recuerda a lo que sucede en la vida real, dijo Roughgarden, a medida que las normas sociales sobre las cuales se debe jugar el equilibrio evolucionan gradualmente.

En el tipo de juegos complejos para los cuales el equilibrio de Nash es difícil de alcanzar, el equilibrio correlacionado es "el principal candidato natural" para un concepto de solución de reemplazo, dijo Nisan.

El hecho de que a la humanidad se le haya ocurrido la idea del equilibrio de Nash antes del equilibrio correlacionado puede ser solo un accidente de la historia, dijo Myerson. "La gente piensa que las ideas que evolucionaron antes son las más fundamentales", dijo, pero en este caso, "¿quién puede decir qué es una idea más fundamental?"

Sin embargo, los resultados sobre la rápida convergencia no implican que ninguna ronda individual del juego se juegue en un equilibrio correlacionado, solo que la historia a largo plazo del juego sí lo es. Esto significa, señaló Rubinstein, que los enfoques de minimización de arrepentimiento no son siempre una opción ideal para los jugadores racionales en una ronda cualquiera. Eso deja la pregunta "¿Qué harán los jugadores racionales?" Sin una respuesta definitiva.

Esta pregunta "ha sido explorada desde antes de que yo naciera", dijo Rubinstein, de 30 años. "Pero aún es el principio".

domingo, 4 de febrero de 2018

Usando teoría de juegos para la crianza


Los niños son maestros manipuladores. Entonces usa la teoría de juegos contra ellos


Wired


LOS NIÑOS SON MANIPULADORES MAESTROS. Ellos juegan con sus encantos, enfrentan a los adultos unos contra otros, y se involucran en gritos fuertes y públicos. Así que es su trabajo mantenerse al día con ellos, dice Kevin Zollman de Carnegie Mellon. Su nuevo libro, The Game Theorist's Guide to Parenting, escrito con el periodista Paul Raeburn, explica cómo.


Cooperación a la fuerza

Para los hermanos que se niegan a trabajar juntos, Zollman recomienda una versión del dilema del prisionero. Asignarles una tarea que puedan hacer juntos, como recoger los juguetes, y luego darles a cada uno la misma recompensa o castigo en función de su desempeño como equipo: si un niño se relaja, es probable que la próxima vez que lo haga se niegue a hacerlo. cooperar, y ambos perderán. Con el tiempo, esta configuración obliga al trabajo en equipo.

Haz que paguen

¿Quién tiene la habitación más grande? ¿Quién puede nombrar al gato? Es el viejo problema del Rey Salomón: algunas cosas que simplemente no puedes cortar a la mitad. Entonces, los niños hacen una oferta con las tareas domésticas o su asignación. Si uno de ellos quiere nombrar al gato Macaroni & Cheese, tendrá que pagarlo.

Amenazarlos-por lo real

Gritar "¡No me hagas girar este auto!" Nunca funciona. Eso es lo que Zollman llama una amenaza no creíble: los niños lo ven, porque saben que significa que tú también sufrirás. Así que elige castigos que te beneficien. Como: "Deja de golpear a tu hermana o vamos a ir a la abuela en lugar de a las películas".

Hazlos mentir

Si sospecha que sus hijos no han hecho su tarea, acéptelos con preguntas específicas: ¿Qué tema? ¿Qué aprendiste? ¿Cuánto tiempo tomó? ¿La parte mas dificil? Incluso si logran respuestas convincentes, el acto de mantener una mentira elaborada ejerce una incomodidad psicológica. Eventualmente, descubrirán que ser honesto es simplemente más fácil.

No los liberes

Para que todas estas lecciones se mantengan, tienes que abrocharte el cinturón. Si su hijo tiene problemas y llora lastimosamente, resista la tentación de irrumpir y salvarla recordando algo que los economistas llaman riesgo moral. Los rescates corporativos incentivan el mal comportamiento: evite este destino estableciendo reglas claras y castigando cuando sea necesario.

domingo, 27 de noviembre de 2016

Aplicaciones: Tinder versión teoría de juegos

Cómo la teoría de juegos mejora las aplicaciones de citas
Demasiada atención no deseada convierte a las usuarias en encuentros en línea. La economía proporciona una solución
URI BRAM | 1843 Magazine




Las aplicaciones tradicionales de citas heterosexuales tienen un defecto fatal: las mujeres se inundan con mensajes de baja calidad, en el mejor de los casos aburridos, en el peor de los casos molestos, hasta el punto de comprobar la bandeja de entrada se convierte en una tarea poco atractiva. En parte como resultado, los hombres ven la mayoría de sus mensajes ignorados. Nadie es feliz, pero nadie puede hacer nada al respecto. Bueno, ninguno de los usuarios, individualmente, puede. Pero una nueva generación de aplicaciones de citas impone limitaciones a los datadores que podrían liberarlas.
Los ejecutivos de las propias aplicaciones tienden a ver el problema como una de las dinámicas de género; Sus innovaciones están destinadas a abordar las experiencias infelices que demasiadas mujeres reportan. Dawoon Kang, cofundadora de Coffee Meets Bagel, dice que "la razón por la que las mujeres no han estado totalmente entusiasmadas con el uso de servicios de citas es porque no había nadie que entendiera cómo las mujeres quieren salir con la fecha." Sarah Mick, Directora Creativa de Bumble , dice que su aplicación quiere terminar con "llamadas desubicadas digitales", y para dar sutilmente a las mujeres más poder en sus interacciones de citas. En sus esfuerzos, ambas aplicaciones emplean estrategias que un teórico del juego aprobaría.
Kang informa que las aplicaciones de citas americanas tradicionalmente tenían una proporción de aproximadamente 60% de los hombres a 40% de las mujeres ", lo que no suena tan extremo, pero si realmente toman en cuenta el nivel de actividad - los hombres son dos veces más activos que las mujeres - Se vuelve aún más desigual; En la base de usuarios activos es más como 80:20. "Este tipo de relación sesgada puede tener efectos enormes en los incentivos de los usuarios; Como ha escrito Tim Harford, un economista, incluso un ligero desequilibrio en un mercado cambia radicalmente el poder del grupo sobre-representado, ya que se ven obligados a competir duro o permanecer solos.
Una forma de ver el problema es como una tragedia de los comunes, donde los usuarios que actúan en su (estrecho) interés personal sobreexplotan un recurso compartido y por lo tanto dañan el bien común, en última instancia, dañándose a sí mismos. El ejemplo clásico es la pesca excesiva: cada pescador individual está tentado a cosechar el océano un poco más y mejorar su pesca actual, pero si todos los pescadores lo hacen, la población de la piscina se desploma y todo el mundo sufre a largo plazo.

En el caso de las citas en línea, el "recurso compartido" es la atención de las mujeres: si cada hombre "sobreexplota el recurso", entonces la atención de las mujeres (y la paciencia) se agota, y las mujeres abandonan la aplicación por completo. Los hombres (y mucho menos las mujeres) se beneficiarían de un acuerdo colectivo para enviar cada vez menos mensajes de mejor calidad, pero no tienen manera de coordinar un acuerdo de este tipo. Cuando Coffee Meets Bagel se lanzó, un punto de venta fue su aplicación de esa política: los usuarios recibieron sólo un partido por día. (Coffee Meets Bagel recientemente cambió a un modelo con más, pero aún limitado, partidos diarios).
Quizás la parte más triste de la tragedia de las citas en línea es que los partidos, a diferencia de los peces, no son remotamente intercambiables. Y sin embargo, en muchas aplicaciones es difícil para un usuario señalar a otro que está profundamente interesado en ella específicamente y no simplemente probar su suerte con todo el mundo. En un sentido, el problema es simplemente que el envío de mensajes es demasiado "barato" - no cuesta nada monetariamente, sino también (en contraste con el mundo real de citas) requiere poco tiempo o incluso la inversión emocional. Como resultado, no sólo las mujeres son inundadas con mensajes, sino que recibir un mensaje se convierte en una señal muy débil de compatibilidad potencial.
En teoría, los hombres pueden hacer una señal costosa a una mujer en cualquier aplicación leyendo cuidadosamente su perfil y enviando un mensaje personal en lugar de un genérico "hey". Pero algunas aplicaciones ofrecen a los usuarios más formas de enviar señales costosas a partidos específicos. Coffee Meets Bagel tiene un botón Woo, donde los usuarios pagan (con la moneda dentro de la aplicación) para enviar una señal extra a una persona específica. Bumble permite a los hombres "extender" uno, y sólo uno, partido cada día, que le dice al destinatario que es (al menos algo) especial para él.
Característica única de Bumble es que sólo las mujeres pueden hacer el primer movimiento (es decir, enviar el primer mensaje). Por supuesto, esto restringe enormemente la actividad de los hombres, pero la restricción rompe el gran problema de coordinación y resuelve la tragedia de los comunes: ya que las mujeres no están siendo inundadas con mensajes, los hombres que coinciden tienen una oportunidad real de una fecha. Incluso para los hombres, los beneficios bien pueden valer el precio.
Bumble tiene varias otras características que influyen estratégicamente en el comportamiento de los usuarios para llevar a más usuarios a conversaciones reales. Por ejemplo, después de un partido se hace, las mujeres sólo tienen 24 horas para empezar a chatear o bien el partido desaparece. Cualquier preocupación de que la respuesta demasiado rápido señalará el exceso de entusiasmo se disipan porque es de conocimiento común que la aplicación no deja opción. Del mismo modo, las mujeres no tienen que preocuparse por cómo serán percibidas para iniciar una conversación. "Tenemos una frase para estas cosas: sólo culpar a Bumble", dice Mick. Las aplicaciones restringen estratégicamente las opciones para desplazar a los usuarios de un mal equilibrio - mensajes de baja calidad y bajas tasas de respuesta - a una mejor.
Mientras que el mercado de las citas siempre tendrá un corazón propio, muchos otros mercados se enfrentan a desafíos similares en la era de Internet. En el mercado de trabajo en línea es trivialmente "barato" para presentar un CV más para un papel más, por lo que los empleadores reciben cientos de pretendientes inadecuados para cada posición abierta. Los cazadores de apartamentos en línea y los propietarios de apartamentos enfrentan niveles similares de inundación y frustración. Con ciertos ajustes, algunas de las estrategias iniciadas por las aplicaciones de citas se podrían utilizar en otros mercados. Donde el amor abre el camino, tal vez otros lo sigan.

sábado, 2 de julio de 2016

Econ 101: Juegos diferenciales

Juegos diferenciales




En la teoría de juegos, los juegos diferenciales son un grupo de problemas relacionados con el modelado y análisis de conflictos en el contexto de un sistema dinámico. Más específicamente, una variable de estado o las variables evolucionan con el tiempo de acuerdo con una ecuación diferencial. Los primeros análisis reflejaron intereses militares, considerando dos actores - el perseguidor y el evasor - con objetivos diametralmente opuestos. Los análisis más recientes han reflejado ingeniería o consideraciones económicas.

La conexión a un control óptimo

Los juegos diferenciales están relacionados estrechamente con los problemas de control óptimo. En un problema de control óptimo existe control único u(t) y un único criterio para ser optimizado; la teoría de juegos diferencial generaliza esto a dos controles u(t), v(t) y dos criterios, uno para cada jugador. Cada jugador intenta controlar el estado del sistema a fin de lograr su objetivo; el sistema responde a las entradas de todos los jugadores.

Historia

Los primeros en estudiar juego diferencial era Rufus Isaacs (1951, publicado 1965) [1] y uno de los primeros juegos analizados fue el "juego del chófer homicida".

Horizonte de tiempo aleatorio

Los juegos con un horizonte de tiempo aleatorio son un caso particular de juegos diferenciales. [2] En este tipo de juegos, el tiempo de terminal es una variable aleatoria con una función de distribución de probabilidad dada. Por lo tanto, los jugadores maximizar la esperanza matemática de la función de coste. Se demostró que el problema de optimización modificado puede reformularse como un juego diferencial actualizados durante un intervalo de tiempo infinito [3] [4]

Aplicaciones

Los juegos diferenciales se han aplicado a la economía. Los acontecimientos recientes incluyen la adición de estocasticidad a la diferencia de juegos y la derivación de las votaciones estocástico equilibrio de Nash (SFNE). Un ejemplo reciente es el juego diferencial estocástica del capitalismo por Leong y Huang (2010). [5]

Para un estudio de juegos diferenciales pos-evasión ver Pachter. [6] Para uno de la implementación de una carrera armamentística en el caso de crecimiento económico ver Larrosa [7].



Notas

  1. Rufus Isaacs, Differential Games, Dover, 1999. ISBN 0-486-40682-2 Google Books
  2. Petrosjan, L.A. and Murzov, N.V. (1966). Game-theoretic problems of mechanics. Litovsk. Mat. Sb. 6, pp. 423–433 (in Russian).
  3. Petrosjan L.A. and Shevkoplyas E.V. Cooperative games with random duration, Vestnik of St.Petersburg Univ., ser.1, Vol.4, 2000 (in Russian)
  4. Marín-Solano, Jesús and Shevkoplyas, Ekaterina V. Non-constant discounting and differential games with random time horizon. Automatica, Vol. 47(12), December 2011, pp. 2626–2638.
  5. Leong, C. K.; Huang, W. (2010). "A stochastic differential game of capitalism". Journal of Mathematical Economics 46 (4): 552. doi:10.1016/j.jmateco.2010.03.007.
  6. Meir Pachter: Simple-motion pursuit-evasion differential games, 2002
  7. Larrosa, J.M.C. (2016), "Arms build-up and arms race in optimal economic growth", International Journal of Economic Theory  Vol. 12 (2), pp. 167–182. DOI: 10.1111/ijet.12087

Textbooks and general references

  • Dockner, Engelbert; Jorgensen, Steffen; Long, Ngo Van; Sorger, Gerhard (2001), Differential Games in Economics and Management Science, Cambridge University Press,ISBN 978-0-521-63732-9
  • Petrosyan, Leon (1993), Differential Games of Pursuit (Series on Optimization, Vol 2), World Scientific Publishers, ISBN 978-981-02-0979-7

martes, 22 de marzo de 2016

El juego del Coronel Bolotto resuelto al fin

Después de casi un siglo, el escenario del coronel Blotto en Teoría de Juegos fue resuelto
Universidad de Maryland



Aunque las reglas del coronel Blotto son relativamente simples, las estrategias potenciales que un jugador puede emplear son casi ilimitadas, dependiendo del número de campos de batalla y los recursos totales disponibles para cada jugador.

Un equipo de científicos de la computación de la Universidad de Maryland, la Universidad de Stanford y Microsoft Research es el primero en resolver un escenario de la teoría de juegos que ha desconcertado a los investigadores durante casi un siglo. El juego, conocido como "coronel Blotto," se ha utilizado para analizar los posibles resultados de las elecciones y otros conflictos entre dos partes similares desde su invención en 1921. Hasta ahora, sin embargo, el juego ha sido de uso limitado, ya que carecía de una definitiva solución.
Un nuevo algoritmo desarrollado por el equipo dirigido por la UMD es capaz de resolver el escenario coronel Blotto. Un logro notable en su propio derecho, el algoritmo podría también proporcionar estrategas políticos, líderes empresariales y otros tomadores de decisiones con una nueva y poderosa herramienta para la toma de decisiones informadas. El equipo informó de sus hallazgos en la Association for the Advancement of Artificial Intelligence (AAAI) Conference en Phoenix el 15 de febrero de 2016.

"Nuestro algoritmo potencialmente puede utilizarse para calcular la mejor estrategia de inversión de recursos para cualquier competidor contra un solo oponente," dijo Mohammad Hajiaghayi, el Jack y Rita G. Minker Profesor Asociado de Ciencias de la Computación en UMD y del plomo en el proyecto. "Siempre y cuando se dispone de datos suficientes sobre un escenario dado, podemos utilizar nuestro algoritmo para encontrar la mejor estrategia para una amplia variedad de líderes, como candidatos políticos, equipos deportivos, empresas y líderes militares."

Coronel Blotto enfrenta a dos competidores contra otras, y cada uno requiere para tomar decisiones difíciles sobre cómo implementar recursos limitados. En su forma más simple, cada jugador asigna un número limitado de recursos, o tropas, a una serie de campos de batalla. Los jugadores deben hacer esto sin ningún conocimiento de la estrategia de su oponente. Los jugadores ganan un campo de batalla dada si se asignan más tropas que su oponente; el jugador que gana la mayoría de los campos de batalla también gana el juego.

El juego se puede extender a los escenarios del mundo real, tales como las elecciones generales presidenciales EE.UU.. En este ejemplo, cada candidato es un jugador; recursos como el personal de la campaña, el tiempo muñón y la financiación son las tropas; y cada estado es un campo de batalla. El juego también se puede aplicar a la competencia de alto perfil de productos de consumo, tales como la batalla en curso entre el iPhone de Apple y los productos de telefonía móvil Android de Google.

"A partir de las elecciones presidenciales a las decisiones de marketing, la competencia por la atención y la lealtad es una parte de la vida diaria. Sin embargo, el comportamiento de los individuos en respuesta a este tipo de competiciones aún no está bien entendido ", dijo Hajiaghayi, que también tiene un nombramiento conjunto en la Instituto de Altos Estudios de Informática de la Universidad de Maryland (UMIACS). "Se demuestra que este tipo de comportamiento estratégico es computacionalmente tratables. Dada la descripción de la competición, podemos determinar qué estrategias de maximizar los resultados para un jugador dado ".

Aunque las reglas del coronel Blotto son relativamente simples, las estrategias potenciales que un jugador puede emplear son casi ilimitadas, dependiendo del número de campos de batalla y los recursos totales disponibles para cada jugador. La solución alcanzada por Hajiaghayi y sus colegas no favorece necesariamente a un jugador sobre otro, sino más bien representa un equilibrio en el que ambos jugadores han desplegado la mejor estrategia que sea posible en relación con la estrategia de su oponente.

La gran variedad de posibles estrategias ha sido el obstáculo clave para encontrar una solución computacional para el juego. Hajiaghayi y su equipo superaron este problema limitando el número total de posibles estrategias para un puñado de opciones representativas.

"Hemos encontrado que las estrategias de los jugadores se pueden representar con precisión por un razonablemente pequeño número de posibilidades", dijo Hajiaghayi. "Este es un enfoque más general, pero funciona bien como una prueba de concepto. Muchos otros han tratado de resolver el coronel Blotto para escenarios específicos, pero son los primeros en adoptar un enfoque más general y resolver la teoría ".

Esta solución permitió al equipo para desarrollar un algoritmo generalizado, que ahora se pueden aplicar a situaciones específicas, tales como la elección presidencial de 2016.

"Nuestro algoritmo sólo funciona para los dos competidores, por lo que tendrá que esperar a que la elección general para tratar de esto", dijo Saeed Seddighin, un estudiante graduado en ciencias de la computación en UMD que presentará los resultados del grupo en la reunión AAAI. "Si sabemos cómo votó un estado dado en las elecciones anteriores en relación con los recursos de cada candidato invertido en ese estado, entonces podemos utilizar los mismos datos de inversión del ciclo de las elecciones de este año para predecir si cada candidato ha desplegado su mejor estrategia posible en todo el país ".

Además de Hajiaghayi y Seddighin, UMD co-autores incluyen Sina Dehghani (estudiante graduado, Ciencias de la Computación) y Hamid Mahini (ex investigador postdoctoral, Ciencias de la Computación.)

El estudio, "A partir de duelos a los campos de batalla: Computación Equilibrios de Blotto y otros juegos," AmirMahdi Ahmadinejad, Sina Dehghani, MohammadTaghi Hajiaghayi, Brendan Lucier, Hamid Mahini y Saeed Seddighin, fue presentado en la Asociación para el Avance de la Inteligencia Artificial (AAAI) Conferencia en Phoenix.

Scientific Computing

domingo, 20 de septiembre de 2015

¿Puede la teoría de juegos ayudar a prevenir las violaciones (in campus)?

¿Puede la teoría de juegos ayudar a impedir la violación?
Una nueva aplicación permite a los estudiantes universitarios la posibilidad de informar sólo un asalto sexual si otra persona es violada por la misma persona.




Olga Khazan - The Atlantic

Una de cada cinco mujeres que asistieron a la universidad durante los últimos cuatro años dicen que fueron agredidos sexualmente, según una encuesta del Washington Post-Fundación de la Familia Kaiser publicado este verano, pero sólo el 11 por ciento dijo a la policía o las autoridades de la universidad.

Las razones del subregistro varían, pero parece que hay cuatro obstáculos principales: las víctimas no quieren llamar la atención sobre sí mismas o sus agresores, no saben si el incidente realmente constituía una "violación", están preocupadas que no les creyeran, o no sabían a quien informar.

Un nuevo sitio, Callisto, tiene como objetivo facilitar a los estudiantes universitarios para documentar-e informar, si así lo desean, sus agresiones sexuales. Con Calisto, un estudiante puede llenar un registro de sellos de tiempo del incidente y luego elegir entre tres diferentes pasos a seguir.

Primero, pueden enviarlo directamente a su coordinador IX campus Título, el punto-persona para las investigaciones de los estudiantes. El proceso de escritura ayuda, creadores de Callisto creen, porque podría reducir las probabilidades de que los administradores de la universidad se encargará de la materia insensible.

"Nuestra esperanza es que ... el coordinador del Título IX será capaz de tener una conversación con más matices", dijo Tracey Vitchers, director de desarrollo y las operaciones para las innovaciones de salud sexual, la organización no lucrativa que diseñó Calisto. "De esa manera el sobreviviente no estará en una posición en la que tienen que contar y contar y volver a contar lo que les pasó."

En segundo lugar, el estudiante podría simplemente guardarlo y decidir si presentar más tarde. Por último, el estudiante puede poner el informe en "juego", es decir el informe sólo será archivado si alguien reporta un asalto por el mismo autor.

Es esta última opción que hace Calisto único. La mayoría de las violaciones son cometidas por delincuentes reincidentes, pero la mayoría de las víctimas conocen a sus atacantes. Algunas víctimas son reacias a denunciar las agresiones porque no están seguros de si se produjo un delito, o que escriben apagado como un incidente de una sola vez. Conocer la existencia de otras víctimas podría ser la gota final que pone fin a sus dudas o su beneficio de la duda. Creadores de Callisto afirman que si podían dejar de autores después de su segunda víctima, el 60 por ciento de las violaciones del campus podría prevenirse.

Este tipo de sistema se basa en parte en un artículo de Michigan Law Review sobre "fideicomisos de información", o sistemas que permiten la transmisión de información sensible de manera que reducir "desventaja del primer movimiento." Según el artículo, los economistas se refieren también a esta como el "problema de hambre-pingüino"

Pingüinos hambrientos se reúnen en el borde de un témpano de hielo, reacios a sumergirse en el agua. Hay comida en el agua, pero una orca podría estar al acecho, por lo que ningún pingüino quiere bucear primero.
Con Callisto, nadie tiene que ser el primer pingüino. Y como el teórico de juegos Michael Chwe señala, el hecho de que cada persona crea su informe independiente hace que sea menos probable que van a ser acusados ​​después de la presentación de informes de imitación, si hay similitudes entre los incidentes.

Calisto se está experimentando en el Pomona College y la Universidad de San Francisco este año, con planes para expandir aún más si se trata de un éxito.

miércoles, 10 de junio de 2015

Explicando el Equilibrio de Nash

Explicando una piedra angular de la teoría de juegos: Equilibrio de John Nash
Por Kenneth Chang - New York Times


John F. Nash Jr., en una ceremonia la semana pasada en Oslo, Noruega, donde fue galardonado con el Premio Abel. Crédito Berit Roald / NTB SCANPIX

John F. Nash Jr. fue más conocido por los avances en la teoría de juegos, que es esencialmente el estudio de la forma de llegar a una estrategia ganadora en el juego de la vida - especialmente cuando usted no sabe lo que están haciendo sus competidores y las opciones que hacer no siempre se ven prometedores.

Dr. Nash no inventó la teoría de juegos; el matemático John von Neumann hizo el trabajo pionero para establecer el campo en la primera mitad del siglo 20. Pero el Dr. Nash extendió el análisis más allá de suma cero, I-ganar-que-perder tipos de juegos en el que todos los jugadores pueden ganar situaciones más complejas, o la totalidad podía perder.

El concepto central es el equilibrio de Nash, más o menos definida como un estado estable en el que ningún jugador puede obtener una ventaja a través de un cambio unilateral de la estrategia de asumir las demás no cambian lo que están haciendo.

La película "Una mente maravillosa", basada en la vida del Dr. Nash, trata de explicar la teoría de juegos en una escena en la que Russell Crowe, jugando Dr. Nash, es en un bar con tres amigos, y todos ellos están embelesado por una bella rubia mujer que camina con cuatro amigos morena.

Una hermosa rubia entra en un bar. ¿Qué deben hacer cuatro tipos? Una Mente Maravillosa
Mientras sus amigos bromas acerca de cuál de ellos sería cortejar con éxito la rubia, el Dr. Nash concluye que deben hacer lo contrario: Ignorar ella. "Si todos vamos por la rubia," dice, "bloqueamos entre sí y ni uno solo de nosotros va a buscarla. Así que vamos a por sus amigos, pero a todos nos dan la espalda porque a nadie le gusta ser la segunda opción. Pero ¿y si nadie va a la rubia? Nosotros no ponemos en el camino del otro y no insultamos a las otras chicas. Esa es la única manera en que ganamos ".

Si bien esto nunca sucedió en la vida real-episodio ilustra algunas de las maquinaciones que los teóricos consideran juego, no es un ejemplo de un equilibrio de Nash.

Un ejemplo más sencillo es lo que se conoce como el dilema del prisionero. Dos conspiradores en un crimen son detenidos y ofreció un trato: "Si confiesas y testifica en contra de su cómplice, se lo haremos fuera y tirar el libro en el otro tipo - 10 años de prisión."

Si ambos permanecen tranquilo, los fiscales no pueden probar los cargos más graves y ambos pasarían sólo un año tras las rejas por delitos menores. Si ambos confiesan, los fiscales no necesitarían su testimonio, y ambos recibirían penas de prisión de ocho años.

A primera vista, guardar silencio puede parecer la mejor estrategia. Si ambos lo hicieron, ambos se baje bastante ligera.

Pero el cálculo del equilibrio de Nash muestra que probablemente haría ambos confiesan.

Este tipo de problema se llama un juego no cooperativo, lo que significa que los dos presos no pueden transmitir intenciones entre sí. Sin saber lo que el otro prisionero está haciendo, cada uno se enfrenta a esta elección: si confiesa, él podría terminar con la libertad u ocho años de prisión. Si se queda tranquilo, él va a la cárcel por un año o 10 años.

En esa luz, confesión es la mejor opción. Y él sabe que el otro prisionero tiene el mismo incentivo para confesar, por lo que es menos probable que se quedaría tranquilo.

Además, el cambio de estrategia para la mamá de permanencia sería un mal movimiento - pena de prisión más larga - a menos que el otro preso de alguna manera también decidió hacer eso. Sin ningún tipo de comunicación, eso sería una suposición muy arriesgada, y por lo tanto, esta estrategia representa un equilibrio de Nash.

La escena de la barra, sin embargo, no lo hace. Con cuatro hombres persiguiendo cuatro morenas, ninguno de los hombres podría tener la tentación de perseguir a la rubia en su lugar, un resultado más deseable si sus amigos no también cambian estrategia.

lunes, 25 de mayo de 2015

Muere Nash y perdemos todos



Nash muere, todos perdemos: ¿Qué es la Teoría de juegos?

Una explicación sencilla de la idea que hizo famoso al Nobel de Economía


JOSÉ ÁNGEL MURCIA El País


Es una pena que a Nash se le esté recordando como el “protagonista” de una película y no como el genio detrás del desarrollo de la Teoría de juegos. A John Forbes Nash le gustaban los juegos, de hecho se le tiene como uno de los dos inventores independientes del juego de mesa que hoy se llama Hex, pero que en Princeton era conocido como “Nash”. Nash buscaba el juego perfecto para los matemáticos. Pero no, cuando los matemáticos hablamos de Teoría de juegos no nos referimos al Hex, ni al Candy Crush, ni a la brisca, estamos hablando fundamentalmente del estudio de las decisiones de los individuos, no de pasarnos vidas.

En Teoría de juegos se analizan situaciones complejas en las que hay más de un individuo que quiere tener éxito pero que tiene que tener en cuenta las decisiones del resto de los intervinientes. Esto es, no vale con preguntarte qué es lo que tienes que hacer tú, sino que tienes que preguntarte qué es lo que tienes que hacer tú teniendo en cuenta lo que piensas que van a hacer los demás. Veamos un ejemplo: te han detenido junto a un compinche, habéis hecho cosas terribles que no voy a contar aquí, pero la policía no tiene pruebas y solo os acusan de algo menor (sí, voy a contar el dilema del prisionero, los que lo conozcan pueden saltarse este párrafo). Pongamos que si no os delatáis el uno al otro vais a pasar tres años de chabolo. Si los dos cantáis (y os delatáis el uno al otro) os caerán 5 años a cada uno. Si canta uno solo, le caerán 12 años al otro y uno al cantor por “colaborar”... Os colocan en habitaciones separadas, claro, esto se pone interesante. Eres una persona inteligente, tu compañero es como tú -no te asocias con cualquiera- ¿qué crees que pasará?

No delatarDelatar
Tu compincheNo delatar3 años para cada uno12 para él, uno para ti
Delatar12 para ti y uno para él5 para cada uno
Llegados a este punto surgen las preguntas, ¿eres egoísta? ¿lo es tu compañero? Para poder proseguir tenemos que suponer algo al respecto, pongamos que los dos lo sois, sois completamente egoístas. Lo mejor sería que no os delataseis ¿no? Pues no, ¿no hemos dicho que sois los dos egoístas? Lo mejor para ti es que el otro no te delate y tú sí a él. Tu sabes que él piensa lo mismo, no querrás ser tú el que se pase 12 años a la sombra mientras él sale en un año ¿no?

La teoría existente antes de las aportaciones de Nash nos haría esperar el Óptimo de Pareto, esto es, ambos os calláis. Las teorías de Pareto nos llevarían a pensar que la mejor solución es que los dos cooperéis. Lo que aportó la “mente maravillosa” de Nash es que tú -conociendo al igual que tu tu socio las ideas de Nash- pienses “si creo que mi compinche no me va a delatar, lo mejor es delatarle, y si creo que me va a delatar, también es mejor para mi delatarle”. Lo que desde entonces se llama alcanzar un equilibrio de Nash: hay una estrategia dominante, debemos esperar que los dos cantéis, que los dos os delatéis, porque es lo único que podéis hacer que garantiza que estáis mejorando vuestras opciones.

Este dilema del prisionero es un ejemplo de juego en el que ambos jugadores pierden, esto es uno de los juegos de suma no nula. Otros matemáticos, como John Von Neumann (sí, el del proyecto Manhattan), ya habían estudiado el equilibrio en los juegos de suma cero (en el que los otros jugadores ganan lo que un jugador pierde). Pero Nash en su tesis doctoral de 1951 describió las situaciones en juegos en los que todos pueden perder. ¿Por qué es tan importante el equilibrio de Nash? Pues porque esta situación en la que hay mutua desconfianza es una situación muy corriente en economía, por eso se firman contratos que comprometen a las partes que suelen ser -como tú y tu compinche- bastante egoístas. Las implicaciones que tuvo el trabajo de Nash le valieron el premio Nobel de Economía en 1994. Sí, de Economía, porque de matemáticas no hay, seguramente porque al inventor de la dinamita no le gustaban las matemáticas.

La teoría de juegos proporciona modelos para entender este tipo de situaciones que se presentan -además de en famosos dilemas- en gestión, economía, psicología… o en partidas de póker, y que involucran por tanto las decisiones de todos los agentes y no solo las de uno. Para poder explicar estas situaciones se utilizan matrices o árboles de decisión.

Pero hoy no es un día de suma cero, hoy todos perdemos.

domingo, 10 de mayo de 2015

Avances en la cooperación desde el punto de vista de la Teoría de Juegos

Teoría de Juegos pone a la cooperación en tela de juicio
Una solución reciente para el dilema del prisionero, un escenario clásico de la teoría de juegos, ha creado nuevos rompecabezas en la biología evolutiva.


Un mono vervet  grita una alarma cuando un depredador está cerca, poniéndose en peligro.
Matt Jenner

Por: Emily Singer - Quanta Magazine


Cuando el manuscrito pasó por su escritorio, Joshua Plotkin, un biólogo teórico de la Universidad de Pennsylvania, fue inmediatamente intrigado. El físico Freeman Dyson y el informático William Press, ambos muy logrado en sus campos, habían encontrado una nueva solución a un famoso, con décadas de antigüedad escenario teoría juego llamado el dilema del prisionero, en el que los jugadores deben decidir si hacer trampa o cooperan con un socio. El dilema del prisionero se ha utilizado para ayudar a explicar cómo la cooperación podría soportar en la naturaleza. Después de todo, la selección natural se rige por la ley del más fuerte, por lo que uno podría esperar que las estrategias egoístas se benefician al individuo sería más probable que persista. Pero un estudio cuidadoso del dilema del prisionero reveló que los organismos podrían actuar en su totalidad en su propio interés y poder crear una comunidad cooperativa.

La nueva solución de Press y Dyson al problema, sin embargo, arrojaron que la perspectiva optimista en tela de juicio. Sugirió las mejores estrategias eran los egoístas que llevaron a la extorsión, no cooperación.

Plotkin encontró matemáticas del dúo notable por su elegancia. Pero el resultado le atormentaba. Naturaleza incluye numerosos ejemplos de comportamiento cooperativo. Por ejemplo, los murciélagos vampiro donan parte de su comida de sangre de miembros de la comunidad que no logran encontrar presas. Algunas especies de aves e insectos sociales rutinariamente ayudan a elevar la cría de otra. Incluso las bacterias pueden cooperar, se adhieran entre sí de modo que algunos pueden sobrevivir al veneno. Si reina la extorsión, lo que impulsa a estos y otros actos de altruismo?

Joshua Plotkin ha aplicado el dilema del prisionero
a las poblaciones en evolución.

El trabajo de Press y Dyson miraron a un clásico escenario de la teoría de juegos - un par de jugadores que participan en la confrontación repetida. Plotkin quería saber si generosidad podría resucitar si las mismas matemáticas se aplicó a una situación que se parecía más a la naturaleza. Así que la refundición de su enfoque en una población, permitiendo que los individuos desempeñan una serie de juegos con todos los demás miembros de su grupo. El resultado de sus experimentos, el más reciente de los cuales fue publicado en diciembre en las Actas de la Academia Nacional de Ciencias, sugiere que la generosidad y el egoísmo a pie una línea precaria. En algunos casos, los triunfos de cooperación. Pero cambiar una sola variable, y la extorsión se hace cargo una vez más. "Ahora tenemos una explicación muy general para cuando se espera que la cooperación, o no se espera, evolucionando en las poblaciones", dijo Plotkin, quien condujo la investigación junto con su colega Alexander Stewart.

El trabajo es totalmente teórica en este momento. Pero los resultados podrían potencialmente tener implicaciones de amplio alcance, la explicación de fenómenos que van desde la cooperación entre los organismos complejos a la evolución de pluricelularidad - una forma de cooperación entre las células individuales.

Plotkin y otros dicen que de Prensa y la obra de Dyson podrían proporcionar un nuevo marco para el estudio de la evolución de la cooperación mediante la teoría de juegos, lo que permite a los investigadores a desentrañar los parámetros que permiten la cooperación de existir. "Básicamente ha revivido este campo", dijo Martin Nowak, biólogo y matemático de la Universidad de Harvard.

Ojo por ojo

Los monos vervets son conocidos por sus llamadas de alarma. Un mono gritará para advertir a sus vecinos cuando un depredador está cerca. Pero al hacerlo, llama la atención peligroso para sí mismo. Los científicos que se remontan a Darwin han tenido dificultades para explicar cómo este tipo de comportamiento altruista evolucionó. Si un alto porcentaje suficiente de monos gritando se interceptado por los depredadores, se esperaría que la selección natural para apagar los gritones en el acervo genético. Sin embargo, no es así, y la especulación de por qué ha llevado a décadas de (a veces caldeado) debate.

Los investigadores han propuesto diferentes mecanismos posibles para explicar la cooperación. La selección de parentesco sugiere que ayudar a los miembros de la familia en última instancia, ayuda al individuo. La selección de grupo propone que los grupos cooperativos pueden ser más probabilidades de sobrevivir que los que no cooperan. Y reciprocidad directa postula que los individuos se benefician de ayudar a alguien que les ha ayudado en el pasado.

El dilema del prisionero ayuda a los investigadores a entender las estrategias simples, tales como la cooperación con miembros de la comunidad generosas y engañar a los tramposos, que pueden crear una sociedad cooperativa en las condiciones adecuadas. Descrita por primera vez en la década de 1950, el dilema del prisionero clásico implica un par de delincuentes que sean capturadas y colocadas en habitaciones separadas. Cada uno se da una elección: confesar o permanecer en silencio. En el mejor resultado, ambos dicen nada y ir libres. Pero ya que ni sabe lo que el otro va a hacer, guardar silencio es arriesgado. Si uno soplones y el otro se queda en silencio, la rata recibe una sentencia más leve mientras que el socio silencioso sufre.


Olena Shmahalo / Quanta Magazine

Incluso los organismos simples, como microbios, se involucran en este tipo de juegos. Algunos microorganismos marinos producen moléculas que ayudan a los recogen hierro, un nutriente vital. Colonias microbianas a menudo tienen los productores y los tramposos - microbios que no tienen el compuesto a sí mismos, pero se aprovechan de las moléculas de sus vecinos.
En un solo caso del dilema del prisionero, la mejor estrategia es la de defecto - delatar a su pareja y tendrás menos tiempo. Pero si el juego se repite una y otra vez, la estrategia óptima cambia. En un solo encuentro, un mono verde que ve a un depredador es más seguro si se queda en silencio. Pero a lo largo de toda la vida, el mono es más probabilidades de sobrevivir si se advierte a sus vecinos de peligro inminente y ellos hacen lo mismo. "Cada jugador tiene el incentivo para desertar, pero en general lo hará mejor si cooperan", dijo Plotkin. "Es un clásico problema de cómo puede surgir la cooperación."

En la década de 1970, Robert Axelrod, un politólogo de la Universidad de Michigan, puso en marcha un torneo round-robin enfrentando a diferentes estrategias de unos contra otros. Para sorpresa de muchos contendientes, el enfoque más simple ganó. Simplemente imitando movimiento anterior del otro jugador, una estrategia llamada ojo por ojo, triunfó sobre los programas mucho más sofisticados.

Estrategias de ojo por ojo se pueden encontrar en todo el mundo biológico. Pares de los peces espinosos, por ejemplo, los depredadores cercanos exploradoras en una especie de dueto ojo por ojo. Si un pez hace que el movimiento arriesgado de lanzándose hacia adelante, el otro responda con un acto similar de valentía. Si uno se queda atrás, con la esperanza de dejar que su pareja tome el riesgo, la pareja también cae de nuevo.

En los últimos 30 años, los científicos han explorado versiones realistas más evolutivamente de dilema del prisionero que la simple versión de Axelrod. Jugadores en un gran torneo de todos contra todos comienzan con un conjunto variado de estrategias - Piense en esto como su aptitud determinada genéticamente. Para imitar la supervivencia del más apto, el ganador de cada interacción engendra más descendencia, que hereda la misma estrategia que sus padres. Así, las estrategias más exitosas crecen en popularidad con el tiempo.

El enfoque ganador depende de una variedad de factores, incluyendo el tamaño del grupo, que las estrategias están presentes en la salida, y con qué frecuencia los jugadores cometen errores. De hecho, la adición de ruido para el juego - un cambio aleatorio en la estrategia que actúa como un sustituto de la mutación genética - termina el reinado de ojo por ojo. En estas circunstancias, una variante conocida como generoso ojo por ojo, lo que implica en ocasiones perdonar la traición de otro, triunfos.

El sabor general de estas simulaciones es optimista - amabilidad paga. "Las estrategias más exitosas a menudo tienden a ser los que no tratan de aprovecharse de otra persona", dijo Nowak.

Introduzca Prensa y Dyson con una dosis oscuro de la desesperación.

Triunfo del Cooperador

A pesar de sus hojas de vida impresionantes, tanto de Press y Dyson eran relativamente nuevos en la teoría de juegos. Eso hizo que su nueva solución al dilema de los 60 años de edad, preso, publicado en las Actas de la Academia Nacional de Ciencias en 2012, aún más inesperado. "Es un papel notable que bien podría haber sido escrito hace 30 años", dijo Plotkin. "La idea matemática en el corazón de su papel se pasó por alto, a pesar de cientos de científicos que estudian la teoría de juegos y sus aplicaciones."

Estrategias de supervivenciaCómo la teoría de juegos reconcilia la evolución con la cooperaciónEn el dilema del prisionero iterado, dos jugadores compiten unos contra otros en una serie de rondas. Luego, los investigadores pueden determinar qué estrategia es la más exitosa en el largo plazo. A continuación, el jugador de la columna izquierda emplea una estrategia generosa, tratando de atraer a su oponente en ayudar por ayudar a veces incluso cuando los defectos oponente. El jugador egoísta a la derecha tiende a desertar, sólo ayudando con la suficiente frecuencia para evitar su oponente de deserción permanente. Cada ronda se anotó mediante el uso de una matriz como el ejemplo bate arriba:
Olena Shmahalo / Quanta Magazine
En un partido de cabeza a cabeza, la estrategia egoísta derrota al generoso. Sin embargo, las mismas estrategias tienen diferentes resultados cuando se aplica a un escenario más realista evolutivamente. En el vídeo a continuación, una población de jugadores se involucra en una serie de cabeza a cabeza se encuentra con mucho a un torneo de todos contra todos. El jugador que "gana" cada encuentro engendra más descendencia que emplean estrategias similares. En este caso, un solo jugador que emplea una estrategia generosa tenderá a difundir su estrategia a través de la población:

En última instancia toda la población se convierte de egoísta a las estrategias generosas. Los biólogos utilizan modelos como este para explicar cómo cooperativa comportamiento persiste en la naturaleza.


Press y Dyson esbozan un enfoque, la extorsión apodado, en el que un jugador siempre puede ganar al optar por desertar de acuerdo con un conjunto prescrito de probabilidades. La estrategia de Press y Dyson es notable, ya que permite a un jugador para controlar el resultado del juego. "La principal innovación consiste en calcular la frecuencia con la que usted puede desertar sin desmotivar a su co-jugador completo", dijo Christian Hilbe, investigador en el grupo de Nowak en Harvard. Por otra parte, el jugador ganador sólo necesita recordar una jugada anterior, pero la estrategia funciona igual de bien que los que incorporan muchas rondas anteriores de juego.

El segundo jugador se ve obligado a cooperar con el extorsionista porque esa es la opción que ofrece la mejor recompensa. "Si soy un extorsionista, de vez en cuando voy a desertar a pesar de que hemos colaborado, en proporción suficiente precisión que no importa lo que haga, voy a tener una ganancia mayor que tú", dijo Plotkin. La situación es una reminiscencia de un proyecto de grupo en la escuela secundaria. Si uno de los miembros de los pantalones del equipo apagado, los estudiantes de conciencia no tienen más remedio que trabajar más duro para ganar una buena calificación.

Press y de Dyson documento original se creó en un contexto teoría clásica de juegos - una serie de interacciones entre un solo par de jugadores. Pero Plotkin y Stewart querían saber lo que sucedería si se aplican el mismo enfoque matemático a un grupo en constante evolución, como los monos verdes o murciélagos vampiros, que se reproducen y sobreviven basados ​​en su aptitud individual. Ellos exploraron la clase más amplia de estrategias exitosas, llamadas estrategias de cero determinantes, que presionado Dyson habían identificado.

Esta clase de estrategias incluye todo lo contrario moral de la extorsión: la generosidad. En general, un jugador que emplea una estrategia generosa siempre cooperará cuando su oponente hace. Si los defectos oponente, el primer jugador que va a cooperar con una cierta probabilidad en un intento de convencer al oponente de nuevo a la generosidad.

Para alivio Plotkin y de Stewart, estrategias generosos en vez de las extorsivos tuvieron más éxito cuando se aplica a poblaciones en evolución. "Encontramos un panorama mucho más optimista", dijo Plotkin, que publicó los resultados en 2013 en las Actas de la Academia Nacional de Ciencias. "Las estrategias más sólidas, las que no pueden ser reemplazados por otras estrategias, son generosos."

La intuición básica es simple. "Extorsión hace bien con un oponente", dijo Plotkin. "Pero en una población grande, ladrón finalmente emparejarse con otro ladrón." Entonces ambos desertar, para conseguir una recompensa más pobre. "Plotkin mejorar nuestro modelo girando al revés", dijo Dyson. "Si quieres a alguien a cooperar con usted, es mejor para sobornar a la persona con beneficios de corto alcance que castigarla de inmediato."

Hilbe confirmó estos hallazgos en un escenario del mundo real, enfrentando a jugadores humanos contra equipos con estrategias bien generosas o extorsionistas. Como se predijo, la gente ganó pagos más grandes cuando se juega contra equipos generosas que contra los egoístas. Pero la gente también tiende a castigar a los opositores de extorsión, negándose a cooperar a pesar de que sería en su mejor interés para hacerlo. Esto a su vez reduce la recompensa por tanto jugador humano y el ordenador. Al final, el equipo generoso ganó un premio más grande que el equipo extorsionista.

La venganza del extorsionista

Teniendo en cuenta estos resultados, Plotkin espera extorsionadores podrían mantenerse a raya. Pero ese optimismo duró poco. Después de su estudio de 2013, Plotkin cambió las rentabilidades que se pueden ganar por cooperar o no. Los jugadores pasaron tanto su estrategia y los beneficios estratégicos a su descendencia; ambas cantidades pueden sufrir mutaciones aleatorias.

 Con esta reorganización al sistema, lo que podría corresponder a un cambio en las condiciones ambientales, el resultado volvió al lado oscuro. Generosidad ya no era la solución preferida. "A medida que las mutaciones que aumentan la tentación de desertar de barrido a través del grupo, la población llega a un punto de inflexión", dijo Plotkin. "La tentación de desertar es abrumadora, y la deserción gobierna el día."

Plotkin dijo que el resultado fue inesperado. "Es sorprendente porque es dentro del mismo marco - la teoría de juegos - que la gente ha utilizado para explicar la cooperación", dijo. "Pensé que incluso si usted permite el juego de evolucionar, la cooperación todavía prevalecería."

La lección es que los pequeños ajustes a las condiciones pueden tener un efecto importante sobre si la cooperación o extorsión triunfos. "Es muy agradable ver que esto lleva a cualitativamente diferentes resultados", dijo Jeff Gore, un biofísico en el Instituto de Tecnología de Massachusetts, quien no participó en el estudio. "En función de las limitaciones, puede evolucionar cualitativamente diferentes tipos de juegos."

Chris Adami, biólogo computacional en la Universidad Estatal de Michigan, sostiene que no hay tal cosa como una estrategia óptima - el ganador depende de las condiciones.

 De hecho, es poco probable que sea el final de la historia del estudio de Plotkin. "Estoy seguro de que habrá gente que mira cómo el resultado depende de los supuestos", dijo Hilbe. "Tal vez la cooperación de alguna manera puede ser rescatado."

Futuro del prisionero

El dilema del prisionero es, obviamente, una versión muy simplificada de las interacciones reales.

Así que lo bueno que un modelo es que para el estudio de la evolución de la cooperación? Dyson no es optimista. Le gustan los estudios de Plotkin y Hilbe de, pero sobre todo porque implican las matemáticas interesantes. "Ciertamente como una descripción de los mundos posibles es muy interesante, pero no se ve a mí como el mundo de la biología", dijo Dyson.

Ethan Akin, un matemático que ha explorado estrategias similares para Prensa y Dyson, dijo que cree que los resultados son más aplicables a la toma de decisiones sociológica que a la evolución de la cooperación.

Pero algunos biólogos experimentales no están de acuerdo, diciendo que tanto el dilema del prisionero y la teoría de los juegos más ampliamente han tenido un efecto profundo en su campo. "Creo que la contribución de la teoría de juegos a la cooperación microbiana es enorme", dijo Will Ratcliff, un biólogo evolutivo en el Instituto de Tecnología de Georgia.

Por ejemplo, los científicos que estudian la resistencia a los antibióticos están utilizando un escenario de la teoría de juegos llamado el juego de la nieve acumulada, en el que un jugador siempre se beneficia de cooperar. (Si está atrapado en su edificio de apartamentos después de una tormenta de nieve, se beneficiará por palear el camino de entrada, pero lo mismo ocurre con todos los demás que vive allí y no tienen una pala.) Algunas bacterias pueden producir y secretar una enzima capaz de desactivar los antibióticos. La enzima es costoso de producir, y las bacterias perezosos que no lo hacen pueden beneficiarse mediante el uso de enzimas producidas por sus vecinos más industriosa. En el escenario del dilema del prisionero estricta, los holgazanes eventualmente matar a los productores, perjudicando a toda la población. Pero en el juego ventisquero, los productores tienen un mayor acceso a la enzima, lo que mejora su condición física, y los dos tipos de bacterias pueden coexistir.

Los microbios en el laboratorio pueden imitar los escenarios de la teoría de juegos, pero si estos ambientes controlados reflejan con exactitud lo que está pasando en la naturaleza es otra historia. "Nos pusimos en la dinámica del juego, asumiendo un cierto tipo de la ecología", dijo Ratcliff. Pero esos parámetros podrían no reflejar hábitat normal del microbio. "Para mostrar que la dinámica de un experimento se ajustan al dilema del prisionero u otros juegos no necesariamente significan esos mecanismos a unidad en la naturaleza", dijo Ratcliff.

domingo, 11 de enero de 2015

Para Gonzalo... La paradoja de Allais

La paradoja de Allais
Por Jonah Lehrer - Wired

Maurice Allais, economista ganador del premio Nobel, murió a principios de este mes. En este post, me voy a centrar en una de sus muchas contribuciones intelectuales, ya que influyó profundamente en la psicología moderna. Se la conoce como la paradoja de Allais, y se esbozó por primera vez en un artículo de 1953 de la revista Econometrica. He aquí un ejemplo de la paradoja:


Supongamos que alguien le ofreció una elección entre dos vacaciones diferentes. Vacaciones número uno le da una probabilidad del 50 por ciento de ganar una gira de tres semanas de Inglaterra, Francia e Italia. Vacaciones número dos le ofrece un tour de una semana de Inglaterra a ciencia cierta.

No es sorprendente que la gran mayoría de la gente (por lo general más de 80 por ciento) prefieren el tour de una semana de Inglaterra. Casi siempre elegimos certeza sobre el riesgo, y estamos dispuestos a negociar dos semanas de vacaciones para la garantía de unas vacaciones de una semana. Una cosa segura sólo parece mejor que un juego de azar que nos pueda dejar sin nada. Pero qué hay de esta apuesta:

Vacaciones número uno le ofrece una probabilidad del 5 por ciento de ganar un viaje de tres semanas de Inglaterra, Francia e Italia. Vacaciones número dos le da una probabilidad del 10 por ciento de ganar un viaje de una semana de Inglaterra.

En este caso, la mayoría de las personas optan por el viaje de tres semanas. Nos damos cuenta de ambas las vacaciones son poco probable que suceda, por lo que bien podría ir a por todas en la gran gira europea. (Las personas actúan de la misma manera que con las loterías: normalmente nos compramos el billete para el premio más grande posible, independientemente de las probabilidades.)

Allais proféticamente se dio cuenta de que este conjunto muy popular de decisiones - casi todas las personas las hacen - violaban los supuestos racionales de la economía. En lugar de tomar decisiones que podrían predecirse por unas pocas ecuaciones matemáticas, la gente actuó con inconsistencia frustrante. Después de todo, las dos preguntas implican 50 porcentaje de reducción en la probabilidad (de 100 por ciento a 50 por ciento, y desde 10 por ciento a 5 por ciento), y sin embargo generan respuestas completamente opuestas. Nuestras elecciones parecían incoherentes.

La paradoja de Allais fue ignorada en su mayoría de los economistas en las siguientes dos décadas. Pero entonces, a principios de 1970, dos psicólogos israelíes, Daniel Kahneman y Amos Tversky, leyeron sobre la paradoja y quedaron intrigados al instante: querían saber por qué la gente no respondía a las probabilidades de una manera lineal. Sobre la base de sus conversaciones con los demás, parecía obvio que las personas perciben una menor diferencia entre las probabilidades de un 1 por ciento y 2 por ciento de entre el 0 por ciento y 1 por ciento, o entre 99 y 100 por ciento. En otras palabras, todos los cambios en el riesgo no son iguales. Como Allais había observado décadas antes, valoramos toda seguridad una cantidad excesiva.

Pero ¿por qué certeza tan atractivo? Kahneman y Tversky querían entender la psicología detrás de la paradoja. Su avance se produjo por accidente. Kahneman había estado leyendo un libro de texto sobre las funciones de utilidad económica, y estaba desconcertado por la manera economistas explican un aspecto particular de nuestro comportamiento. Al evaluar una apuesta apuestas-como en una mano de póquer, o invertir en un específicos existencias economistas asumido que tomamos la decisión, teniendo en cuenta nuestra riqueza en su conjunto. (Ser racional requiere factoring en toda la información relevante.) Pero Kahneman se dio cuenta de que esta no es la forma en que pensamos. Los jugadores en Las Vegas no se sientan alrededor de la mesa de juego contemplando su cartera financiera completa. En su lugar, tomar decisiones rápidas que dependen por completo de las condiciones inmediatas de la apuesta. Si hay una apuesta de $ 100, y usted está tratando de decidir si desea o no que la apuesta con un par de ases, probablemente no está pensando en la evolución reciente de su fondo de inversión, o el valor de su casa.

Pero si no tomamos decisiones basadas en un conjunto completo de información, entonces, ¿en qué están basadas nuestras decisiones? ¿Qué factores afectaban realmente nuestras elecciones? Kahneman y Tversky se dieron cuenta de que la gente pensaba acerca de los resultados alternativos en términos de ganancias o pérdidas, y no en términos de estados de la riqueza. El juego de póquer jugador sólo se ocupa de las virutas a la derecha delante de él, y la posibilidad de ganar (o perder) esa cantidad específica de dinero. (El cerebro es una máquina limitada, y no puede pensar en todo a la vez.) Esta simple visión llevó Kahneman y Tversky a comenzar a revisar el formato de sus experimentos. En ese momento, ellos consideraban esto como nada más que un ajuste técnico, una manera de hacer que sus cuestionarios psicológicamente más realista.

Este pequeño cambio en la notación pronto reveló uno de los descubrimientos más importantes de su carrera. Cuando Kahneman y Tversky enmarcadas preguntas en términos de ganancias y pérdidas, de inmediato se dieron cuenta de que la gente odiaba pérdidas. De hecho, nuestra aversión a las pérdidas fue en gran parte responsable de nuestra aversión de riesgo en general. Porque nos sentimos los inconvenientes de decisiones arriesgadas (pérdidas) con más intensidad que las ventajas (ganancias), la mayoría de los riesgos nos parecieron malas ideas. Esto también hizo de las opciones que se podrían prever con certeza parecen especialmente atractiva, ya que eran libres de riesgo. Como Kahneman y Tversky ponen, "En la toma de decisiones pérdidas humanas, lucen más grandes que las ganancias." Ellos llamaron a este fenómeno "aversión a la pérdida"

Esta sencilla idea tiene profundas implicaciones. Por un lado, se revela un sesgo profundamente integrado en nuestro cerebro. Desde la perspectiva de la economía, no hay una buena razón para ponderar las ganancias y pérdidas de manera tan diferente. Los costos de oportunidad (ganancias no percibidos) deben ser tratados como "fuera de su bolsillo los gastos" (pérdidas). Pero no son - las pérdidas llevan una picadura emocional particular. Tome este escenario imaginario:

Los EE.UU. están preparando para el brote de una enfermedad asiática inusual, que se espera para matar a 600 personas. Se han propuesto dos programas alternativos para combatir la enfermedad. Suponga que las estimaciones científicas exactas de las consecuencias de los programas son los siguientes: Si se adopta el programa A, 200 personas se salvarán. Si se adopta el programa B, hay un tercio de probabilidades de que 600 personas se guardarán y una probabilidad de dos tercios que ningún pueblo se guardarán. ¿Cuál de los dos programas le favorecen?

Cuando se hizo esta pregunta a una amplia muestra de los médicos, el 72 por ciento eligió la opción A, la estrategia de seguridad y seguro, y sólo el 28 por ciento eligió el programa B, la estrategia arriesgada. En otras palabras, los médicos prefieren un seguro bueno sobre una apuesta que corre el riesgo de fracaso. Ellos están actuando igual que la gente que eligen el seguro tour de una semana de Inglaterra. Pero ¿qué pasa con este escenario:

Los EE.UU. están preparando para el brote de una enfermedad asiática inusual, que se espera para matar a 600 personas. Se han propuesto dos programas alternativos para combatir la enfermedad. Suponga que las estimaciones científicas exactas de las consecuencias de los programas son los siguientes: Si se adopta el programa C, 400 personas morirán. Si se adopta el programa D, hay un tercio de probabilidades de que nadie va a morir y una probabilidad de dos tercios que 600 personas morirán. ¿Cuál de los dos programas le favorecen?

Maurice Allais
Estas dos preguntas diferentes examinan dilemas idénticos. Almacenamiento de un tercio de la población es la misma que la pérdida de dos tercios. Pero cuando Kahneman y Tversky enmarcan el escenario en términos de pérdidas, los médicos cambiaron su decisión anterior. Sólo el 22 por ciento votó por la opción C, mientras que el 78 por ciento de ellos optó por la opción D, la estrategia arriesgada que podría salvar a todos. Por supuesto, esto es un cambio en la preferencia ridículo, ya que nada sustancial ha cambiado en el escenario. * Pero nuestras decisiones están guiadas por nuestros sentimientos, y las pérdidas sólo nos hacen sentir mal. Debido a que las ecuaciones insensible de la clásica emoción negligencia economía, su descripción de nuestras decisiones permaneció deplorablemente incompleta.

Y esto nos devuelve a Maurice Allais. Sería fácil descartar su paradoja como un asunto sin importancia, una debilidad irrelevante de toma de decisiones humanas. Pero lo que realmente ayudó a llevar a una revisión radical de la naturaleza humana. (Daniel Kahneman ganó el Premio Nobel en 2002.) Nos hemos dado cuenta de que no somos tan racionales como nos gusta creer, que el cerebro es impulsado por todo tipo de sentimientos inarticulados e instintos preprogramados. Vale la pena señalar, sin embargo, que la investigación moderna en nuestra irracionalidad no comenzó con un escáner cerebral, o con las discusiones de la amígdala. En su lugar, comenzó con unas pocas personas inconsistentes, la toma de decisiones económicas sobre sus vacaciones. Leonard Cohen lo dijo mejor: "Hay una grieta en todo - así es como entra la luz." Allais encontró una grieta importante.

* Los pacientes exhiben una tendencia similar: Cuando se les preguntó si optaban por la cirugía en una emergencia médica hipotética, el doble de personas optaron por pasar por el quirófano cuando se le dio la oportunidad de supervivencia en un 80 por ciento, que cuando se le dio la oportunidad de la muerte como 20 por ciento.