Clasificación del comportamiento humano usando Teoría de Juegos

Investigadores de la Universitat Rovira i Virgili, Universitat de Barcelona, Universidad de Zaragoza y Universidad Carlos III de Madrid hemos colaborado para llevar a cabo un experimento social y determinar si existen distintos tipos de comportamientos o estrategias, cuando se trata de enfrentarse a distintos dilemas sociales (o juegos con distintas matrices de pago).

El experimento se llevó a cabo durante el DAU Barcelona, el Festival de Juegos que organiza el ayuntamiento de la ciudad.

Realizar el experimento en un lugar público nos permitió reclutar personas de distintas edades y condiciones, de modo que nuestra población para el estudio fue mucho más variada que en otros experimentos similares, típicamente realizados exclusivamente con estudiantes universitarios.

Cada individuo tuvo que jugar en torno a 13-18 rondas de juegos. Cada ronda era un juego distinto (Dilema del Prisionero, Armonía, Caza del Ciervo y Chicken Contest) con diferentes matrices de pagos (es decir, de este modo exploramos el plano T-S en su totalidad). Además, jugaban cada ronda con distintos oponentes (anónimos y aleatorios). Recogimos datos de 541 personas, acumulando en total mas de 8.600 decisiones de juego.

Uno de los aspectos mas novedosos de nuestro trabajo es el hecho de que, en lugar de tratar de clasificar a los sujetos a priori y de acuerdo con las teorías existentes, nosotros elegimos utilizar un algoritmo de clasificación que no sabe nada sobre Teoría de Juegos, y examinar si los grupos encontrados pueden ser explicados a posteriori, usando dicha teoría.

Específicamente, usamos el algoritmo K-means para clasificar los sujetos de acuerdo a sus elecciones en los distintos juegos, y encontramos que el número óptimo de grupos para los datos recogidos es 5. A continuación describimos brevemente los 5 grupos.

  • Confiados: cooperan en todos los juegos, para cualquier valor de la matriz de pagos. Constituyen un 17% de la poblacion estudiada.
  • Envidiosos: este grupo es el de mayor tamaño encontrado en nuestro estudio (30%), y defectan en todo el plano T-S, con excepción del triángulo superior dentro del cuadrante del juego de Armonía. Este resultado es muy sorprendente, ya que nunca antes se había reportado defección en dicho juego (de hecho, el juego de Armonía no tiene un dilema como tal). El motivo por el que esta población defecta en una región del juego del Armonía, y el todo el resto del plano, es porque su motivación es ganar más que su oponente, aunque esto suponga que al final, ellos mismos ganan menos que el máximo posible para un juego dado.
  • Optimistas: este grupo constituye el 20% de la población, y su motivación está guiada por el optimismo: eligen en cada caso la acción que podría darles máximo beneficio (asumiendo que las cosas les saldrán bien, y su oponente no lesestropeará el plan).
  • Pesimistas: son la contrapartida del grupo anterior, y el 21% de la población. Su objetivo es minimizar las posiblespérdidas, eligiendo la opción con la que perderán menos, renunciando a intentar una acción que podría reportarles mayor beneficio (y asumiendo que el oponente no les ayudaría a que ese plan saliera bien).
  • Finalmente, el algoritmo encuentra un grupo pequeño (12%) de individuos que parecen comportarse sin una regla clara.

Es importante remarcar que, en primer lugar, ninguno de estos grupos (a excepción de los Confiados) había sido reportado en la literatura previamente. En segundo lugar, ninguno de los grupos encontrados (ni tampoco el grupo de la población en su conjunto) se comporta de acuerdo con los equilibrios de Nash de cada juego, pero sin embargo, es evidente que, si no racionales en el sentido clásico dictado por Nash, los individuos de este estudio siguen reglas muy bien definidas a la hora de tomar sus decisiones.

Estos resultados tienen aplicación directa en diversos ámbitos, desde selección de personal y trato con clientes en empresas, a la implementación de políticas que requieran entender los incentivos a los que responde la población (por ejemplo, cambio climático, cooperación internacional ante catástrofes humanitarias, o conflictos armados).

Figura_Poncela_et_al
Figura 1: Diagrama de cooperación representando el comportamiento de cada uno de los 5 grupos encontrados en este trabajo, así como de la población en su conjunto agregando los datos de todos los individuos participantes. El rojo representa un 100% de decisiones cooperativas, mientras que el azul representa un 0% de acciones cooperativas. El plano T-S permite separar los 4 dilemas sociales en distintos cuadrantes. El cuadrante superior izquierdo es el juego de Armonía, el superior derecho es el juego de Chicken Contest, el inferior izquierdo es la Caza del Ciervos, y el inferior derecho es el Dilema del Prisionero. Para cada grupo o fenotipo (para cada columna), representamos el valor empírico de cooperación en todo el plano, el comportamiento ideal inferido (etiquetado “numerical”), así como las reglas de comportamiento en función de los parámetros de la matriz de pagos (donde Cooperador contra Cooperador gana R, Cooperador contra Defector gana S, Defector contra Cooperador gana T, Defector contra Defector gana P). Es importante resaltar que al agregar los comportamientos de cada grupo, pesados por la fracción relativa que representan ante el conjunto de la población, recuperamos con buena aproximación el comportamiento experimental de la población entera (última columna).

Referencia al artículo original:
Julia Poncela-Casasnovas, Mario Gutiérrez-Roig, Carlos Gracia-Lázaro, Julian Vicens, Jesús Gómez-Gardeñes, Josep Perelló, Yamir Moreno, Jordi Duch and Angel Sánchez (2016) Humans display a reduced set of consistent behavioral phenotypes in dyadic games
Science Advances  05 Aug 2016. Vol. 2, no. 8, e1600451.