19
Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable Juego dinámico El problema subyacente y las estrategias de los jugadores son dinámicos. Hay un entorno de juego (game environment) que cambia de un período a otro y afecta a las ganancias en el juego de etapa de cualquier período. El entorno puede cambiar por razones ajenas a la voluntad de los jugadores o puede cambiar a causa de lo que hacen los jugadores.

Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Embed Size (px)

Citation preview

Page 1: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes.

El juego de etapa que se juega en cada interacción es estático e inmutable

Juego dinámico El problema subyacente y las estrategias de los jugadores son dinámicos.

Hay un entorno de juego (game environment) que cambia de un período a otro y afecta a las ganancias en el juego de etapa de cualquier período.

El entorno puede cambiar por razones ajenas a la voluntad de los jugadores o puede cambiar a causa de lo que hacen los jugadores.

Page 2: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Uso de un recurso de propiedad común: tragedia de los comunes

Fuentes de externalidad en el uso de un recurso de propiedad común: • el uso de cada persona puede disminuir los beneficios para el uso de las otras personas

(externalidad actual) • la utilización conjunta puede afectar a la condición futura del recurso (externalidad futura).

Entorno del juego=tamaño del recurso

Características del entorno• Evoluciona a través del tiempo de acuerdo con el patrón de uso en el pasado

Cuantas más personas utilizan el recurso o cuanto más intensamente es utilizado menos hay en el futuro.

• Afecta a los pagos en cada juego de etapa.El resultado del uso hoy en día marca el uso futuro.

La pregunta clave es cuánto aprovechamiento supone este "mejor" uso del recurso.

Page 3: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

MODELO SIMPLE (dos períodos de tiempo)

• Recurso de propiedad común de tamaño y> 0. • Cada uno de los dos jugadores puede retirar una cantidad c1 o c2 no negativa • La función de utilidad es logarítmica y a un consumo c le corresponde una utilidad log(c)• La cantidad total consumida no puede sobrepasar el recurso, c1 + c2 ≤ y.• El intento de consumir en exceso se traduce en que la cantidad total se reparte entre ellos,

es decir, cada jugador termina por consumir y/2. • Cuando el consumo total es menor que y, la cantidad sobrante, y-(c1 + c2), es la futura

base del recurso y, por tanto, del consumo futuro.

Sólo hay un periodo más de consumo

Page 4: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

INDUCCIÓN HACIA ATRÁS

Período 2• Cada jugador decide la cantidad a consumir de la cantidad a su disposición y- (c1 + c2). • Puesto que no hay más períodos, cada jugador consumirá tanto como sea posible. • En el período 2, la cantidad total se divide entre ellos y cada uno tiene (y - (c1 + c2)) / 2

Periodo 1• El primer jugador determina la cantidad a consumir a partir del stock disponible • Su utilidad depende de la cantidad que el jugador 2 decida consumir (su consumo

determina el tamaño de los recursos que quedarán para el segundo periodo). • El jugador 1 determina su nivel de consumo mediante un problema de mejor respuesta

en función de la cantidad que el jugador 2 va a consumir en el primer período, c2

Page 5: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

SOLUCIÓNLa mejor respuesta de consumo del jugador 1 es

R1 (c2) = (y - c2) / 2 La mejor respuesta de consumo del jugador 2 es

R2 (c1) = (y - c1) / 2El equilibrio de Nash viene dado por los niveles de consumo de c1* y c2* tales que

R1 (c2*) = R2 (c1*). Sustituyendo en las funciones de reacción, el equilibrio de Nash es c1* = c2* = y /3.

En el primer período, cada jugador consume y/3, dejando un total de y/3 para el segundo período,En el segundo períodoesta cantidad se divide por la mitad con un consumo de y/6 cada uno. La utilidad para cada jugador

log (y /3) + log (y/ 6)=2log (y )- log 18

Page 6: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Uso socialmente óptimo.

• Los dos jugadores constituyen una sociedad y se reúnen para decidir cuánto debe consumir cada uno por el "bien común“.

• Bien común supone asegurarse de que la utilidad total se maximiza. • Un patrón de consumo, (c1*, c2*), es socialmente óptimo si se maximiza la suma de la

utilidad de los dos jugadores, es decir, si se soluciona el problema siguiente:

Este procedimiento conduce a una solución socialmente óptimaC1*= C2 *=y/4

Cada jugador consume un cuarto del recurso en cada período La utilidad para cada jugador es

2log (y /4)=2log (y) –log 16

Page 7: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Comparación del equilibrio con el uso socialmente óptimo

Equilibrio de Nash dos terceras partes de los recursos se utilizan en el primer período.

Uso socialmente óptimo la mitad del recurso se utiliza en el primer período

Tragedia de los comunes.Exceso de extracción del recurso en el equilibrio de Nash

Criterio individual (utilidad propia)Si el jugador 1 recorta su consumo en el primer periodo en una unidad, hace que haya una unidad disponible para el consumo de ambos jugadores en el segundo períodoEs capaz de recuperar sólo la mitad de esta unidad adicional en el segundo período, debido a que la otra mitad queda para el jugador 2.

Criterio social (utilidades de ambos jugadores)Una unidad de consumo dejada para mañana por cualquiera de los jugadores sigue siendo en el segundo periodo una unidad de consumo para la sociedad en su conjunto.

Page 8: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Problema en grandes poblacionesSea N el número de jugadores y c1,…,cN sus consumos

En el equilibrio de Nash • Cada jugador consume la misma cantidad con un nivel de consumo en equilibrio de

c1* = c2* =... = cN* =y/ (N +1). • El consumo total es

Ny/(N +1).• La cantidad que queda después del primer período es

y/(N +1). Si N es grande una pequeña cantidad del recurso alcanza el segundo periodo

En el uso social • El consumo que maximiza la utilidad conjunta de todos los jugadores es

c1= c2=... = cn = y/2N • El consumo total es

y/2• La cantidad que queda después del primer período es

y/2Independientemente de N la mitad del recurso alcanza el segundo periodo

A medida que el número de jugadores aumenta la tragedia es aún más grave.

Page 9: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Ejercicio Considere la siguiente variante del modelo en la que en el primer período el jugador 1 extrae una cantidad c1 y el jugador 2 una cantidad c2. Lo que no se extrae, es decir, la cantidad y-c1 - c2, se regenera y se convierte en una cantidad igual a en el periodo 2.

Con el fin de que la cantidad de recurso crezca y sea mayor que y-c1-c2, suponemos y ≤ 1 (esto es una convención, si la cantidad máxima real es 100 multiplicamos la función de regeneración por √ 100). El resto del modelo es idéntico, en particular, la función de utilidad es log c y la regla de asignación si el total deseado es más de lo disponible sigue siendo dar la mitad a cada uno.

• Plantear el problema de mejor respuesta del jugador 1.• Demostrar que la función de mejor respuesta viene dada por R1 (c2) = 2 (y-c2)/ 3.• Calcular el equilibrio de Nash.• Demostrar que la extracción socialmente óptima es y/3 para cada jugador.

¿En qué se diferencia del modelo de recurso agotable en el que la extracción socialmente óptima es y/4 para cada jugador?

• Analizar el problema de los recursos renovables para N jugadores. ¿Es cierto que todos los recursos se extrae en el primer período si N tiende a infinito?

Page 10: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Problema de los comunes con interacción continua y recursos renovables

• El consumo del jugador i en el período t es ci (t) , con ci(t) ≥ 0 . • El consumo da a los jugadores una utilidad log(ci(t))

• El entorno del juego en el período t es el tamaño de los recursos, y(t), con y (t) ≥ 0 . • El valor de y(t) limita el consumo total c1(t) +c2(t) ≤ y (t) .

• La base de inversión que genera el recurso futuro, x(t), es la cantidad no extraídax(t) =y(t )-(c1(t)+c2(t))≥ 0.

• La inversión produce el recurso del próximo período (función de producción)y(t +1)=

El juego continúa siempre y cuando exista un nivel de recursos positivos y, por tanto, potencialmente, puede continuar para siempre.

Las preguntas de interés son ¿La interacción estratégica conduce a la sobreexplotación del recurso?¿Cómo evoluciona el stock del recurso y (t)?¿Hay una cantidad de recursos que es sostenible en el tiempo?

Page 11: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Solución socialmente óptima

Maximizamos la suma de las utilidades de los dos jugadores (inducción hacia atrás)

Supongamos que sólo queda un periodo

En el último periodo si el stock es y tenemos que resolver

En este último periodo nunca queda ningún stock sin uso, es decir, c1 + c2 = y.

Por lo tanto el problema de maximización puede reescribirse como

Con solución c1 = c2 = y/2.

En consecuencia, la utilidad social óptima de cada jugador cuando sólo queda una etapa corresponde al stock disponible y está dada por

donde A (1) es una abreviatura para la constante.

Page 12: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Supongamos que quedan dos períodos la extracción social óptima se encuentra al resolver el siguiente problema:

donde la utilidad del segundo periodo se descuenta un periodo mediante el factor de descuento δ.

Después de algunos cálculos, podemos reescribir el problema un poco más simple como

donde hemos suprimido las constantes aditivas.

Las condiciones de primer orden hacen que el consumo sea c1 = c2 = y / (2 + δ).

La utilidad social óptima por jugador cuando quedan dos etapas depende del stock disponible y viene dada por

Que puede escribirse como

Page 13: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Supongamos que quedan tres períodos de uso de recursos. En el primer período tenemos que resolver el siguiente problema:

Después de sustituir V2 y suprimir todas las constantes irrelevantes, podemos reescribirlo

El consumo social óptimo es c1=c2=y/2

La utilidad social óptima per cápita es de la forma

En esta etapa podemos ver un patrón y hacer una conjetura Cuando el número de períodos restantes es T, el consumo social óptimo es

Page 14: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

En el modelo de infinitos períodos en cada etapa hay exactamente el mismo número de períodos restantes y la fracción de consumo de cada etapa es idéntica.

• El consumo viene dada por el límite del consumo óptimo cuando T tiende a infinito.

• La función de inversión es .

Por lo tanto, la fracción de la inversión óptima asociada es δ / 2

• La utilidad socialmente óptima, por extrapolación, viene dada por

• Obsérvese que

• El stock de recurso sostenible socialmente óptimo es 100δ / 2 (punto fijo de la ecuación)

Page 15: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Extracción unilateral del recurso.

En este caso, cada jugador sólo considera su propia utilidad y trata de maximizarla

Supongamos que estamos en el último períodoComo no hay más períodos después, cada jugador intentará consumir cuanto más mejor y el stock se divide a partes iguales entre los dos.

En este periodo el consumo de cada jugador es c1 = c2 = y/2.

la utilidad de equilibrio de cada jugador viene dada por

Page 16: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Supongamos que quedan dos períodos. En este periodo los jugadores van a consumir una fracción del recurso c1= θ1y, c2 = θ2y

El jugador 1 se enfrenta al siguiente problema de mejor respuesta

Este problema puede ser escrito de forma equivalente como

Se puede demostrar que la mejor respuesta de consumo es

En equilibrio, y

Cada jugador consume con la misma tasa de extracción (equilibrio simétrico)

La utilidad de equilibrio cuando quedan dos períodos se puede escribir como

Page 17: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Cuando quedan T períodos

la tasa de extracción de equilibrio es

En el modelo con infinitos períodos,

La función de consumo de equilibrio, c* (y) = θy, vendrá dada por el límite del consumo de equilibrio cuando T tiende a infinito

La función de inversión es

Obsérvese

el stock del recurso sostenible en equilibrio es (punto fijo de la ecuación)

Page 18: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Comparación del óptimo social y los resultados del equilibrioConsideremos dos sociedades distintas, una en la que se gestiona el consumo socialmente y otra en la que se determina de manera unilateral.

• La función de consumo socialmente óptima c (y) es siempre menor que la función de consumo en equilibrio (dando cada individuo su mejor respuesta) c*(y)

• Imaginemos que ambas sociedades comienzan con el mismo stock En el período 2, la primera sociedad tendría un stock más grande, ya que invirtió más en el primer período. Este aumento implica a su vez que esta sociedad vuelve a invertir más en el periodo 2.

• La primera sociedad invierte una fracción más grande de cualquier stock. • La primera sociedad cuenta con un stock de recursos más grande disponible.

• El stock sostenible, y (t +1) = y (t), es más alto en el primer caso que en el segundo. • En el primer caso el stock sostenible es y = 100δ/2 • En el segundo caso el stock sostenible es y* = 100δ / (4-δ)

Page 19: Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable

Conclusiones

En el juego con horizonte infinito cada jugador decide cuánto consumir sólo mirando el tamaño del recurso actual (estrategia markoviana)

no requiere que el jugador tenga información de lo que ha hecho su rival en el pasado o de cómo el recurso ha evolucionado en períodos anteriores.

Un equilibrio perfecto en subjuegos mediante estrategias markovianas recibe el nombre de equilibrio perfecto de Markov (MPE). • Si el número de entornos es finito siempre existe un MPE. • Si el número de entornos es infinito no podemos garantizar que exista un MPE

La conclusión final sobre este equilibrio es que está siempre por debajo de la solución socialmente óptima. Se extrae demasiado recurso y las utilidades de equilibrio son más bajas que las utilidades socialmente óptimas.

Usando estrategias del disparador a veces se puede remediar este problema. Si los jugadores creen que en el futuro el buen comportamiento será recompensado y el mal comportamiento castigado son propensos a cooperar.