¿Cómo explica la teoría de los juegos evolutivos por qué la interacción podría resultar en un equilibrio de Nash sin suponer que los jugadores son racionales?

En EGT, se supone que los individuos en la población no solo no son racionales sino que no tienen otra opción : nacen con sus genes y sus genes dictan su comportamiento.

Hablaré sobre el caso de un emparejamiento de 1 población. Esto requiere que el juego bajo consideración sea un juego simétrico.

Ahora, en cada “ronda” (punto en el tiempo) todos los individuos de una población (que generalmente se considera un continuo) se extraen de la población e interactúan entre sí. Esto generalmente ocurre en parejas, pero uno puede imaginar que estas interacciones ocurren en entornos (juegos) de más de dos personas.

Después de eso, los individuos que fueron emparejados, siguen sus estrategias respectivas (recuerde, sus genes determinan sus estrategias) y obtienen aptitud física basada en la estructura de pagos del juego. La condición física representa la cantidad de niños que cada individuo enviará a la siguiente generación (ronda). Los niños deben seguir la estrategia de sus padres (heredan los genes de los padres). Por lo tanto, se puede determinar la población de la próxima generación. El proceso se repite con la nueva generación y así sucesivamente.

Es obvio que el proceso descrito anteriormente describe un sistema dinámico. Resulta (y, sí, hay un teorema para eso, ver Weibull, 1995) que los puntos estacionarios interiores de este sistema son equilibrios de Nash en el sentido de que si, por ejemplo, [math] \ mathbf {x} = (x_1, x_2) [/ math] (lo que significa que una proporción [math] x_1 [/ math] tiene el gen de tipo 1 y una proporción [math] x_2 [/ math] tiene el gen de tipo 2) es un punto estacionario, el mixto La estrategia donde el individuo sigue la acción 1 con probabilidad [math] x_1 [/ math] y la acción 2 con probabilidad [math] x_2 [/ math] es un equilibrio de Nash simétrico.

El punto importante aquí es notar que no se requiere noción de racionalidad. Si una estrategia hace mejor que otra obtiene más seguidores. En un punto fijo, todas las estrategias empleadas (todas las estrategias puras en el soporte de la estrategia mixta) deben producir la misma aptitud (recompensa). Este es el único caso en el que todas las estrategias tendrán la misma “tasa de crecimiento” (en el modelo dinámico) y, por lo tanto, [math] \ mathbf {x} [/ math] se asignará a sí mismo. Con suerte, puede ver la similitud con la noción de equilibrio de Nash.

Referencia

Weibull, JW (1995). Teoría evolutiva del juego. Cambridge Massachussets: The MIT Press.

Lo hace demostrando que un proceso evolutivo (cultural o biológico) puede llevar a Nash.

La intuición detrás de esto es que puede pensarse que tanto la racionalidad instantánea como la evolución más gradual o el aprendizaje de prueba y error realizan una especie de optimización.

En la teoría tradicional de juegos de elección racional, los equilibrios de Nash corresponden a recomendaciones colectivas hechas a agentes racionales. En la teoría de juegos evolutivos, los equilibrios de Nash (pueden) corresponden a los picos (locales o globales) de un proceso dinámico.

Sin embargo, tenga en cuenta que los procesos dinámicos en la teoría de juegos evolutivos pueden representar cosas muy diferentes: el aprendizaje de prueba y error (por ejemplo, dinámicas de aprendizaje por refuerzo), el aprendizaje a través de la imitación de estrategias exitosas (por ejemplo, imitar las mejores dinámicas), o incluso la evolución biológica a través de la selección natural (por ejemplo, la dinámica del replicador), y así sucesivamente.

Estas dinámicas a menudo (pero no siempre [ver: ciclos y atractores extraños]) convergen y permanecen en estrategias o comportamientos particulares. A veces, aunque no siempre, estos serán equilibrios de Nash.

Intuitivamente, esto tiene sentido. La idea básica del concepto de equilibrio de Nash es la de un estado (una combinación de estrategias por agentes) donde ningún individuo puede mejorar cambiando unilateralmente su estrategia.

Cuando un proceso evolutivo ha convergido y se ha mantenido en un estado particular, este estado debería tener la propiedad de Nash: si hubiera una mejor estrategia disponible para cualquiera de los agentes, la evolución no habría permanecido en este estado.

Por lo tanto, ser un equilibrio de Nash es una condición necesaria para ser un óptimo local de muchos procesos evolutivos. Pero no es suficiente. (Los equilibrios de Nash pueden ser inestables o pueden no ser atractivos).

Para volver a la pregunta esencial de cómo los modelos evolutivos pueden mostrar que los agentes pueden aprender (o evolucionar) para jugar a Nash sin ser racionales: lo hacen de diferentes maneras según la dinámica.

Cada dinámica evolutiva es una descripción de un proceso, y para comprender por qué cualquier proceso dado puede converger en un Nash, debemos examinarlo, específicamente.

De los tres ejemplos que mencioné (aprendizaje de refuerzo, imitación de lo mejor y dinámica de replicador) ninguno asume nada como la racionalidad clásica. Ninguno asume el conocimiento común, el aprendizaje bayesiano, las preferencias transitivas o completas, o, en el caso de la dinámica del replicador, cualquier racionalidad (el éxito reproductivo diferencial puede hacer todo el trabajo en esa interpretación).

Lo que es interesante es que estos procesos de aprendizaje y evolución tan diferentes a menudo convergerán en las mismas predicciones hechas por el concepto de Nash de alta racionalidad.

Para aprender más sobre la conexión entre Nash (y sus refinamientos, como los equilibrios perfectos de subjuegos, los equilibrios de manos temblorosas, ESS, NSS y ESSets, entre otros) y los modelos evolutivos, recomiendo consultar los siguientes textos fantásticos:

  • J. Weibull (1995) Teoría evolutiva del juego.
  • WH Sandholm (2010) Juegos de población y dinámica evolutiva.

Si estás interesado en juegos de forma extensa en particular:

  • R. Cressman (2003) Dinámicas evolutivas y juegos de formas extensivas.

Y si estás interesado en la dinámica del replicador en particular:

  • J. Hofbauer y K. Sigmund (1998) Evoluciónary Games and Population Dynamics.

En la teoría evolutiva del juego, la “racionalidad” puede no asumirse en su forma habitual, pero la “aptitud” (es decir, la combinación de rasgos que permite que una estrategia o especie particular sobreviva a múltiples rondas) ciertamente lo es. Dado que sobrevivir a múltiples rondas requiere superioridad de alguna manera, la racionalidad puede evitarse como un requisito simplemente porque la supervivencia no depende de ello. Si esto suena extraño, considera lo siguiente: si el juego es béisbol, 2 derrotas 1. Si el juego es golf, 1 derrotas 2. Si el juego es reproductores de MP3, Apple derrota a Microsoft. Si el juego sobrevive hasta mañana, los sacerdotes griegos derrotan a Socraties. Todo es independiente de cuán “racionales” son los jugadores. Esencialmente, el juego (y sus reglas) se determinan externamente, en lugar de depender de los consumidores u otros agentes económicos (a los que se debe suponer que son “racionales” para que su comportamiento y reacciones sean modelados como si fueran extrínsecamente implementados ), evitando por completo el requisito de racionalidad.