Tema 3 - Grupo C+D

Transcripción

Tema 3 - Grupo C+D
TEMA 3 JUEGOS REPETIDOS:
TEOREMAS Y PARADOJAS
ORGANIZACIÓN INDUSTRIAL
EUROPEA
GRADO EN ECONOMIA
Prof. Andrés Faíña
OIE.TEMA 3: SUMARIO
1. Juegos repetidos: Conceptos básicos y
ejemplos.
2. Paradojas en los juegos de equilibrio único
con horizonte finito y cierto: Dilema de
los Presos y Cadena de Almacenes.
3. Juegos con horizonte infinito o incierto:
Estrategias de Gatillo y de Represalia.
Multiples equilibrios y Teorema Folk.
1
Juegos repetidos: El dilema de los
prisioneros como ejemplo de un negocio
EL EJEMPLO: Si ambos cumplen su parte del trato, obtienen las ganancias
normales del negocio 1. El que defrauda gana el doble a expensas del que cumple.
Si ninguno cumple no hay negocio.
Estrategia de J2
Coopera
E
s
t
r
a
t
e
g
i
a
J
1
Defrauda
1
2
C
1
-1
-1
D
2
0
0
JUEGO EN FORMA NORMAL:
G = (S1,S2,U1,U2)
– Conjuntos de Estrategias Puras
S1 = S2 = {C, D}
– Funciones de pagos U1,U2
• El juego de etapa posee el único
equilibrio (D,D)
• ¿qué ocurre si el juego se repite en
períodos sucesivos? ¿Promesas de
cooperacion y amenazas de castigo
pueden generar cooperación?
JUEGOS REPETIDOS: CONCEPTOS
BASICOS I
• Sea G un juego en forma normal, G=(S1, S2, ..., Sn;
U1,U2, ..., Un), es decir un par de Conjuntos de
Estrategias (Si) y Funciones de Pagos (Ui) para
cada uno de los jugadores: Se denotará por GT el
juego que resulta de repetir el juego de base o
etapa, G, un número T de veces.
• El concepto de estrategia se complica un poco. Ya
no puede interpretarse como una simple acción
para el juego de etapa. En el juego repetido una
estrategia debe especificar el plan completo de
decisiones del jugador para cada una de las
posibles historias del juego, Ht, en cada uno de los
períodos t del juego.
2
H3 = 64 ...Ht Historias: Dilema
H1 = 4
H2 = 16
J1
J1
J2
C
C
......
C
D
......
D
C
......
D
D
......
C
C
......
C
D
......
D
C
......
D
D
......
C
C
......
C
D
......
D
C
......
D
D
......
C
C
......
C
D
......
D
C
......
D
D
......
C
C
D
D
J2
C
D
C
D
Clasificación
de los Presos
La historia • Los subjuegos
en cada
pueden clasificarse
nuevo
según los tipos de
historias que los
período se
preceden.
bifurca en
cuatro nue- • Cada juego de etapa
inicia un subjuego.
vas ramas.
El bloque • Los subjuegos
deben empezar en
sombreado
nodos donde la
de 4
historia anterior del
posibles
juego es de dominio
resultados
público (un CI de
del juego
único nodo).
de etapa
JUEGOS REPETIDOS: CONCEPTOS BASICOS II
• Esto es análogo al concepto de estrategia en la formulación
extensiva, donde el juego, Γ, era el sexteto, Γ=(K, P, Y, C, p, h),
formado por el árbol, los nodos de los distintos jugadores, los
conjuntos de información, las elecciones de los jugadores, las
probabilidades para el azar y las funciones de pagos. El juego
repetido ΓT denotará de forma análoga el juego que resulta de la
repetición T veces del juego de base o etapa, Γ.
• Una estrategia es un plan completo de decisión del jugador ante
cualquiera de las contingencias del juego que especifica la
elección a tomar en todos y cada uno de sus conjuntos de
información.
• Las estrategias de los jugadores en ΓT deberán especificar en cada
período t de T una estrategia de Γ para cada una de las posibles
historias del juego hasta ese período. Formalmente las estrategias
del juego repetido son correspondencias desde el conjunto de
todas las posibles historias del juego a las estrategias del juego
base en los T períodos.
3
El dilema de los presos repetido:
Paradoja con horizonte finito y cierto
• El juego acaba en un
. período cierto y finito T.
• En el último período, sea
C
C
cual sea la historia del
juego, la estrategia
C
D
C
D
J2
J2
dominante es defraudar.
J1
J1
• Luego en el período
C
C
anterior T-1, ocurre igual
D
J2
D
J2
y asi sucesivamente.
D
D
• El único equilibrio
perfecto es defraudar
Jugadores J1 y J2,
siempre. No importa la
Estrategias: Coopera, C, Defrauda, D.
duración de T.
Dos agentes racionales no aprovechan las ganancias de la cooperación:
100 en 100 períodos, por tratar de anticiparse al otro para ganar 2 -y no
perder 1- en el período 101 y en los inmediatos anteriores.
LA PARADOJA DE LOS JUEGOS REPETIDOS
UN NUMERO CIERTO Y FINITO DE VECES
• La paradoja generada por la inducción hacia atrás (retrospectiva) no
sólo afecta al dilema de los presos: ocurre igual con todos aquellos
juegos de etapa que sólo poseean un único equilibrio.
• La paradoja fue formulada inicialmente para la “Cadena de
Almacenes” por SELTEN (1978).
• Pero la aplicación al dilema de los presos es muy importante porque
recoge los dilemas de incentivos implicados en las desviaciones del
equilibrio de Nash del Juego de Etapa, como ocurre en casos tan
importantes como los de colusión en los modelos Bertrand y
Cournot.
• Empíricamente, los resultados difieren de los obtenidos por
inducción retrospectiva. AXELROD (1981) mostró que la la
estrategia del Talión resultaba ganadora en concursos con dilema de
los presos repetidos.
• Origen paradoja: las situaciones reales modelizadas como juegos
repetidos se caracterizan por ser de información incompleta.
4
Monopolio y juegos entrada
Lucha
Entra
J1 0
J2 0
J2
J1
Comparte
No Entra
J1 1
J2 1
J1 0,5
J2 2
• Sólo un Equilibrio
perfecto en
subjuegos: (E,C)
• Si el juego se
repite, el
monopolista estará
interesado en
luchar para
desanimar futuras
entradas.
• Desanimar una
entrada compensa
los costes de un
período de lucha
La Paradoja de la Cadena de Almacenes
Lucha
Lucha
Entra
M
P
Entra
Comparte
No Entra
M
P
Comparte
No Entra
• Con información completa: Si T cierto y finito, la inducción hacia atrás genera
la paradoja SELTEN (1978, T & D): En el último período, para cualquier
posible historia, no hay nada que ganar luchando. El entrante T-1 lo sabe, luego
entra. Entonces nada se consigue luchando contra el entrante T-2, quién lo sabe
y entra y, así ...sucesivamente.... El único equilibrio perfecto en subjuegos es:
Todos entran y el Monopolista siempre comparte.
• Estos resultados no son robustos. Cuando T es infinito o incierto cambian
radicalmente.
• Información incompleta: Si existen dudas sobre los pagos del entrante
(KREPS&WILSON, 1982, JET) o sobre los pagos del monopolista cuando
lucha (MILGROM&ROBERTS, 1982, JET), aunque sean pequeñas, existen
equilibrios razonables donde el Monopolista lucha creando una reputación que
previene la entrada.
5
JUEGOS REPETIDOS: DESCUENTO
EN HORIZONTE INFINITO
•El factor de descuento: si cada período se devenga un tipo de
interés de “r” por uno, los valores actuales de los pagos en el
período siguiente se descontarán por:

1
;0  r  1  0    1
1 r
Entre el factor de descuento y la tasa de interés existe la
siguiente relación inversa:
r
1 


1

 1; 0    1  0  r  1
Propiedad la serie de potencias de δ converge a un valor
finito (suma de los términos de una progresión geométrica
de razón menor que 1)

   2   3  ...    t 
t 1

1 
JUEGOS REPETIDOS: DESCUENTO
Y PROBABILIDAD EN HORIZONTE
FINITO PERO INCIERTO
• δ puede interpretarse también para analizar los juegos que se
repiten un número aleatorio de veces. Esto proporciona una
analogía formal entre los juegos repetidos de horizonte infinito y
de horizonte indeterminado. La probabilidad constante de que el
juego de etapa se acabe en una ronda es 0<p<1. Existe entonces
una probabilidad positiva de que el juego continúe un período
más de (1-p).
• La probabilidad de que el juego llegue al período t será (1-p)t.
De manera que para el interés “r”, el factor esperado de
descuento será:

1 p
; 0  (1  p)  1 y 0  r  1  0    1
1 r
6
Valor óptimo y ganancia media en
Juegos Infinitamente Repetidos
•El valor óptimo de los subjuegos que arrancan en períodos
subsiguientes permite analizar este tipo de juegos. En el juego repetido
infinitamente G cualquier subjuego a partir del período t es igual al
juego original. Es también un juego infinito y su valor óptimo será el
mismo, V. Si t es el pago de equilibrio de t, entonces los valores
óptimos de los subjuegos con inicio en t y en t+1 han de cumplir:
V   t   .V
Definición: Dado el factor de descuento  , y la sucesión
(infinita) de ganancias 1, 2, 3,..., t,...., se denomina ganancia
media el pago o ganancia, û, cuyo valor descontado equivale al
de la sucesión, esto es:

_
 t u 
t 1

1
_

_

u    t . t  u  (1   ).  t 1 . t
t 1
t 1
EL TEOREMA FOLK
• FRIEDMAN (1971) probó que los juegos repetidos infinitamente pueden
sustentar equilibrios con pagos superiores a los del equilibrio del juego
base. En el caso de los juegos bipersonales FUDEMBERG y MASKIN
(1986) demuestran que en los juegos repetidos infinitamente puede
sustentarse por un equilibrio cualquier vector de pagos factible que
conceda a cada jugador una ganancia superior a su pago de reserva (el
mayor pago que cada jugador puede garantizarse con independencia de lo
que hagan los demás)
• TEOREMA FOLK (FRIEDMAN 1971): Sea un juego de etapa con
información completa G=(Si,  i) (Denominamos  a las funciones de
pagos para que no se confundan con las H de historias). Sean e=(e1,....,en)
las ganancias en un equilibrio de Nash de G y sean x=(x1,...,xn) otras
ganancias factibles cualquiera de G. Si xi>ei para cada jugador i y si  está
lo suficientemente cerca de 1, existe un equilibrio de Nash perfecto en
subjuegos del juego repetido infinitamente G que proporciona como
ganancia media tales pagos factibles de G x=(x1,...,xn).
7
EQUILIBRIO DE ESTRATEGIA
DETONANTE I
• Consideremos la siguiente estrategia detonante o de gatillo
(Trigger): Jugar axi en la primera etapa y, a continuación, en
cualquier etapa t-ésima: 1) jugar axi si en la historia Ht ningún
jugador se ha desviado nunca de axi –no existe ningún adi en Ht- y
2) aei en cualquier otro caso.
• Veamos si es un equilibrio de Nash: Si todos los jugadores ( –i)
siguen tal estrategia, la mejor respuesta de i será seguirla también:
– En cualquier etapa t1, con una historia que contenga alguna
desviación, los restantes jugadores ( –i) eligirán ae-i de manera
que será óptimo para i jugar aei
– En cualquier historia sin desviación o en la primera etapa al
jugador i le interesara seguir tal estrategia y jugar axi si el valor
esperado es superior al de adi .
EQUILIBRIO DE ESTRATEGIA
DETONANTE II
Valor esperado de adi  di   .ei   2 .ei  ...  di 

1 
.ei


d i  1   .ei Si es óptimo adi

Valor óptimo esperado Vi  
 x   .V
Si es óptimo a xi
i
 i

Jugar axi es una mejor respuesta 

xi

 di 
ei
1 
1 
d i  xi
d i  ei
8
EQUILIBRIO DE ESTRATEGIA
DETONANTE III
Como d i  xi  ei para cada i se cumple que
d i  xi
1
d i  ei
Si  esta próximo a 1, la estrategia será de equilibrio si :
d x
  max i i para cada i  1,..., n
i
d i  ei
Veamos ahora que la estrategia detonante es un equilibrio perfecto en
subjuegos. Efectivamente: 1) Los subjuegos cuya historia no contiene
ninguna desviación adi son iguales al juego completo y por tanto la
estrategia detonante es un equilibrio de Nash y 2) En aquellos otros
subjuegos cuya historia contenga una desviación adi, los jugadores
accionan el disparador y juegan el equlibrio del juego de etapa ae que es
también un equilibrio de este subjuego.
TEMA 8: JUEGOS REPETIDOS:
APLICACIONES EN MODELOS DE
OLIGOPOLIO
1. Promesas y amenazas: Estrategias creíbles
de premio y castigo
2. Colusión en modelos de Bertrand: precios
e incentivos a medio plazo. Precios de
Monopolio y equilibrios perfectos de
Pareto.
3. Colusión en modelos de Cournot:
Cantidades de Monopolio y equilibrios
perfectos de Pareto.
9
COMPETENCIA DE BERTRAND:
EQUILIBRIOS Y DESVIACIONES
• Consideremos una función lineal de demanda normalizada:
P= 1 – Q <=> Q = 1 – P.
• Consideremos que los costes medios están también
normalizados a cero: c = 0.
• Las producción de monopolio será ½, el precio de monopolio
será también ½, y el beneficio de monopolio será por tanto ¼.
• El equilibrio de competencia en precios del juego de etapa de
Bertrand es P = c = 0 (nula diferencia entre precio y coste
medio), la cantidad producida total será 1, y el beneficio de
cada empresa 0.
• Las empresas ganarán más en un acuerdo de cartel que en el
equilibrio del juego de etapa, la desviación máxima que
pueden obtener es beneficio de monopolio de un período 1/4
COMPETENCIA DE BERTRAND Y NUMERO DE
EMPRESAS: DESVIACIONES Y DESCUENTO
Nº E
E Etapa
Cartel
Desv. Max.

P

2
0
0
1/2
1/8
(1/2)- 1/4
0,50
3
0
0
½
1/12 (1/2)- ¼
0,66
4
0
0
1/2
1/16 (1/2)- ¼
0,75
5
0
0
1/2
1/20 (1/2)- ¼
0,80
...
...
…
...
N
0
0
1/2
...
P
...


P
...
...
1/4N (1/2)- 1/4 (N-1)/N
10
COMPETENCIA DE COURNOT:
EQUILIBRIOS Y DESVIACIONES
• Normalizando a 1 el tamaño del mercado y a cero los
costes, la función de precios de venta resulta: P=1-Q
• Los equilibrios del juego de etapa en función del número
de empresas son:
– a) Cantidades individuales qi*=1/(N+1),
– b) Cantidad total Q*=N/(N+1),
– c) Precio P=1/(N+1),
– d) Beneficio i=1/(N+1)2
• En un acuerdo de cártel la producción total y el precio
serán los de monopolio (1/2), las producciones
individuales serán la enésima parte: qiM=1/2.N.
COMPETENCIA DE COURNOT:
EQUILIBRIOS Y DESVIACIONES
CONTINUACION
El mejor pago que resulta de de desviarse del acuerdo colusivo
(desviación máxima) resultará:
max qi (1  qi  QMi )  max qi (1  qi 
qid 
N 1
) Lo que implica :
2.N
N 1
4.N
La mejor desviación será en consecuenc ia :
N 1  N 1 
 di  q (1  q 
)

2.N
 4.N 
d
i
2
d
i
11
COMPETENCIA DE COURNOT Y NUMERO DE
EMPRESAS: DESVIACIONES Y DESCUENTO
Nº
E.
E. ETAPA
q
p

CARTEL
q p 
DESV. MAX.
q
p

2
3
4
5
6
...
1/3
1/3
0,111
1/4
1/2 0,125
3/8
3/8
0,141
0,529
1/4
1/4
0,063
1/6
1/2 0,083 4/12
4/12
0,111
0,571
1/5
1/5
0,040
1/8
1/2 0,063 5/16
5/16
0,098
0,609
1/6
1/6
0,028 1/10 1/2 0,050 6/20
6/20
0,090
0,642
1/7
1/7
0,020 1/12 1/2 0,042 7/28
7/28
0,085
0,671
...
...
N
...
... ...
1
1
1
1
2
N  1 N  1 ( N  1) 2 N
1
2
...
1
4N
...
...

...
...
N 1 N 1  N 1  d   c


4N
4 N  4.N   d   e
2
COLUSION EN EL MODELO DE
COURNOT: GRAN NUMERO EMPRESAS
Nº Empresas
2
5
10
15
20
25
50
100
250
500
1000
d
0,1406
0,0900
0,0756
0,0711
0,0689
0,0676
0,0650
0,0638
0,0630
0,0628
0,0626
x
0,1250
0,0500
0,0250
0,0167
0,0125
0,0100
0,0050
0,0025
0,0010
0,0005
0,0003
e
0,1111
0,0278
0,0083
0,0039
0,0023
0,0015
0,0004
0,0001
0,0000
0,0000
0,0000
delta
0,529
0,643
0,752
0,810
0,846
0,871
0,929
0,962
0,984
0,992
0,996
12