Tema 3 - Grupo C+D
Transcripción
Tema 3 - Grupo C+D
TEMA 3 JUEGOS REPETIDOS: TEOREMAS Y PARADOJAS ORGANIZACIÓN INDUSTRIAL EUROPEA GRADO EN ECONOMIA Prof. Andrés Faíña OIE.TEMA 3: SUMARIO 1. Juegos repetidos: Conceptos básicos y ejemplos. 2. Paradojas en los juegos de equilibrio único con horizonte finito y cierto: Dilema de los Presos y Cadena de Almacenes. 3. Juegos con horizonte infinito o incierto: Estrategias de Gatillo y de Represalia. Multiples equilibrios y Teorema Folk. 1 Juegos repetidos: El dilema de los prisioneros como ejemplo de un negocio EL EJEMPLO: Si ambos cumplen su parte del trato, obtienen las ganancias normales del negocio 1. El que defrauda gana el doble a expensas del que cumple. Si ninguno cumple no hay negocio. Estrategia de J2 Coopera E s t r a t e g i a J 1 Defrauda 1 2 C 1 -1 -1 D 2 0 0 JUEGO EN FORMA NORMAL: G = (S1,S2,U1,U2) – Conjuntos de Estrategias Puras S1 = S2 = {C, D} – Funciones de pagos U1,U2 • El juego de etapa posee el único equilibrio (D,D) • ¿qué ocurre si el juego se repite en períodos sucesivos? ¿Promesas de cooperacion y amenazas de castigo pueden generar cooperación? JUEGOS REPETIDOS: CONCEPTOS BASICOS I • Sea G un juego en forma normal, G=(S1, S2, ..., Sn; U1,U2, ..., Un), es decir un par de Conjuntos de Estrategias (Si) y Funciones de Pagos (Ui) para cada uno de los jugadores: Se denotará por GT el juego que resulta de repetir el juego de base o etapa, G, un número T de veces. • El concepto de estrategia se complica un poco. Ya no puede interpretarse como una simple acción para el juego de etapa. En el juego repetido una estrategia debe especificar el plan completo de decisiones del jugador para cada una de las posibles historias del juego, Ht, en cada uno de los períodos t del juego. 2 H3 = 64 ...Ht Historias: Dilema H1 = 4 H2 = 16 J1 J1 J2 C C ...... C D ...... D C ...... D D ...... C C ...... C D ...... D C ...... D D ...... C C ...... C D ...... D C ...... D D ...... C C ...... C D ...... D C ...... D D ...... C C D D J2 C D C D Clasificación de los Presos La historia • Los subjuegos en cada pueden clasificarse nuevo según los tipos de historias que los período se preceden. bifurca en cuatro nue- • Cada juego de etapa inicia un subjuego. vas ramas. El bloque • Los subjuegos deben empezar en sombreado nodos donde la de 4 historia anterior del posibles juego es de dominio resultados público (un CI de del juego único nodo). de etapa JUEGOS REPETIDOS: CONCEPTOS BASICOS II • Esto es análogo al concepto de estrategia en la formulación extensiva, donde el juego, Γ, era el sexteto, Γ=(K, P, Y, C, p, h), formado por el árbol, los nodos de los distintos jugadores, los conjuntos de información, las elecciones de los jugadores, las probabilidades para el azar y las funciones de pagos. El juego repetido ΓT denotará de forma análoga el juego que resulta de la repetición T veces del juego de base o etapa, Γ. • Una estrategia es un plan completo de decisión del jugador ante cualquiera de las contingencias del juego que especifica la elección a tomar en todos y cada uno de sus conjuntos de información. • Las estrategias de los jugadores en ΓT deberán especificar en cada período t de T una estrategia de Γ para cada una de las posibles historias del juego hasta ese período. Formalmente las estrategias del juego repetido son correspondencias desde el conjunto de todas las posibles historias del juego a las estrategias del juego base en los T períodos. 3 El dilema de los presos repetido: Paradoja con horizonte finito y cierto • El juego acaba en un . período cierto y finito T. • En el último período, sea C C cual sea la historia del juego, la estrategia C D C D J2 J2 dominante es defraudar. J1 J1 • Luego en el período C C anterior T-1, ocurre igual D J2 D J2 y asi sucesivamente. D D • El único equilibrio perfecto es defraudar Jugadores J1 y J2, siempre. No importa la Estrategias: Coopera, C, Defrauda, D. duración de T. Dos agentes racionales no aprovechan las ganancias de la cooperación: 100 en 100 períodos, por tratar de anticiparse al otro para ganar 2 -y no perder 1- en el período 101 y en los inmediatos anteriores. LA PARADOJA DE LOS JUEGOS REPETIDOS UN NUMERO CIERTO Y FINITO DE VECES • La paradoja generada por la inducción hacia atrás (retrospectiva) no sólo afecta al dilema de los presos: ocurre igual con todos aquellos juegos de etapa que sólo poseean un único equilibrio. • La paradoja fue formulada inicialmente para la “Cadena de Almacenes” por SELTEN (1978). • Pero la aplicación al dilema de los presos es muy importante porque recoge los dilemas de incentivos implicados en las desviaciones del equilibrio de Nash del Juego de Etapa, como ocurre en casos tan importantes como los de colusión en los modelos Bertrand y Cournot. • Empíricamente, los resultados difieren de los obtenidos por inducción retrospectiva. AXELROD (1981) mostró que la la estrategia del Talión resultaba ganadora en concursos con dilema de los presos repetidos. • Origen paradoja: las situaciones reales modelizadas como juegos repetidos se caracterizan por ser de información incompleta. 4 Monopolio y juegos entrada Lucha Entra J1 0 J2 0 J2 J1 Comparte No Entra J1 1 J2 1 J1 0,5 J2 2 • Sólo un Equilibrio perfecto en subjuegos: (E,C) • Si el juego se repite, el monopolista estará interesado en luchar para desanimar futuras entradas. • Desanimar una entrada compensa los costes de un período de lucha La Paradoja de la Cadena de Almacenes Lucha Lucha Entra M P Entra Comparte No Entra M P Comparte No Entra • Con información completa: Si T cierto y finito, la inducción hacia atrás genera la paradoja SELTEN (1978, T & D): En el último período, para cualquier posible historia, no hay nada que ganar luchando. El entrante T-1 lo sabe, luego entra. Entonces nada se consigue luchando contra el entrante T-2, quién lo sabe y entra y, así ...sucesivamente.... El único equilibrio perfecto en subjuegos es: Todos entran y el Monopolista siempre comparte. • Estos resultados no son robustos. Cuando T es infinito o incierto cambian radicalmente. • Información incompleta: Si existen dudas sobre los pagos del entrante (KREPS&WILSON, 1982, JET) o sobre los pagos del monopolista cuando lucha (MILGROM&ROBERTS, 1982, JET), aunque sean pequeñas, existen equilibrios razonables donde el Monopolista lucha creando una reputación que previene la entrada. 5 JUEGOS REPETIDOS: DESCUENTO EN HORIZONTE INFINITO •El factor de descuento: si cada período se devenga un tipo de interés de “r” por uno, los valores actuales de los pagos en el período siguiente se descontarán por: 1 ;0 r 1 0 1 1 r Entre el factor de descuento y la tasa de interés existe la siguiente relación inversa: r 1 1 1; 0 1 0 r 1 Propiedad la serie de potencias de δ converge a un valor finito (suma de los términos de una progresión geométrica de razón menor que 1) 2 3 ... t t 1 1 JUEGOS REPETIDOS: DESCUENTO Y PROBABILIDAD EN HORIZONTE FINITO PERO INCIERTO • δ puede interpretarse también para analizar los juegos que se repiten un número aleatorio de veces. Esto proporciona una analogía formal entre los juegos repetidos de horizonte infinito y de horizonte indeterminado. La probabilidad constante de que el juego de etapa se acabe en una ronda es 0<p<1. Existe entonces una probabilidad positiva de que el juego continúe un período más de (1-p). • La probabilidad de que el juego llegue al período t será (1-p)t. De manera que para el interés “r”, el factor esperado de descuento será: 1 p ; 0 (1 p) 1 y 0 r 1 0 1 1 r 6 Valor óptimo y ganancia media en Juegos Infinitamente Repetidos •El valor óptimo de los subjuegos que arrancan en períodos subsiguientes permite analizar este tipo de juegos. En el juego repetido infinitamente G cualquier subjuego a partir del período t es igual al juego original. Es también un juego infinito y su valor óptimo será el mismo, V. Si t es el pago de equilibrio de t, entonces los valores óptimos de los subjuegos con inicio en t y en t+1 han de cumplir: V t .V Definición: Dado el factor de descuento , y la sucesión (infinita) de ganancias 1, 2, 3,..., t,...., se denomina ganancia media el pago o ganancia, û, cuyo valor descontado equivale al de la sucesión, esto es: _ t u t 1 1 _ _ u t . t u (1 ). t 1 . t t 1 t 1 EL TEOREMA FOLK • FRIEDMAN (1971) probó que los juegos repetidos infinitamente pueden sustentar equilibrios con pagos superiores a los del equilibrio del juego base. En el caso de los juegos bipersonales FUDEMBERG y MASKIN (1986) demuestran que en los juegos repetidos infinitamente puede sustentarse por un equilibrio cualquier vector de pagos factible que conceda a cada jugador una ganancia superior a su pago de reserva (el mayor pago que cada jugador puede garantizarse con independencia de lo que hagan los demás) • TEOREMA FOLK (FRIEDMAN 1971): Sea un juego de etapa con información completa G=(Si, i) (Denominamos a las funciones de pagos para que no se confundan con las H de historias). Sean e=(e1,....,en) las ganancias en un equilibrio de Nash de G y sean x=(x1,...,xn) otras ganancias factibles cualquiera de G. Si xi>ei para cada jugador i y si está lo suficientemente cerca de 1, existe un equilibrio de Nash perfecto en subjuegos del juego repetido infinitamente G que proporciona como ganancia media tales pagos factibles de G x=(x1,...,xn). 7 EQUILIBRIO DE ESTRATEGIA DETONANTE I • Consideremos la siguiente estrategia detonante o de gatillo (Trigger): Jugar axi en la primera etapa y, a continuación, en cualquier etapa t-ésima: 1) jugar axi si en la historia Ht ningún jugador se ha desviado nunca de axi –no existe ningún adi en Ht- y 2) aei en cualquier otro caso. • Veamos si es un equilibrio de Nash: Si todos los jugadores ( –i) siguen tal estrategia, la mejor respuesta de i será seguirla también: – En cualquier etapa t1, con una historia que contenga alguna desviación, los restantes jugadores ( –i) eligirán ae-i de manera que será óptimo para i jugar aei – En cualquier historia sin desviación o en la primera etapa al jugador i le interesara seguir tal estrategia y jugar axi si el valor esperado es superior al de adi . EQUILIBRIO DE ESTRATEGIA DETONANTE II Valor esperado de adi di .ei 2 .ei ... di 1 .ei d i 1 .ei Si es óptimo adi Valor óptimo esperado Vi x .V Si es óptimo a xi i i Jugar axi es una mejor respuesta xi di ei 1 1 d i xi d i ei 8 EQUILIBRIO DE ESTRATEGIA DETONANTE III Como d i xi ei para cada i se cumple que d i xi 1 d i ei Si esta próximo a 1, la estrategia será de equilibrio si : d x max i i para cada i 1,..., n i d i ei Veamos ahora que la estrategia detonante es un equilibrio perfecto en subjuegos. Efectivamente: 1) Los subjuegos cuya historia no contiene ninguna desviación adi son iguales al juego completo y por tanto la estrategia detonante es un equilibrio de Nash y 2) En aquellos otros subjuegos cuya historia contenga una desviación adi, los jugadores accionan el disparador y juegan el equlibrio del juego de etapa ae que es también un equilibrio de este subjuego. TEMA 8: JUEGOS REPETIDOS: APLICACIONES EN MODELOS DE OLIGOPOLIO 1. Promesas y amenazas: Estrategias creíbles de premio y castigo 2. Colusión en modelos de Bertrand: precios e incentivos a medio plazo. Precios de Monopolio y equilibrios perfectos de Pareto. 3. Colusión en modelos de Cournot: Cantidades de Monopolio y equilibrios perfectos de Pareto. 9 COMPETENCIA DE BERTRAND: EQUILIBRIOS Y DESVIACIONES • Consideremos una función lineal de demanda normalizada: P= 1 – Q <=> Q = 1 – P. • Consideremos que los costes medios están también normalizados a cero: c = 0. • Las producción de monopolio será ½, el precio de monopolio será también ½, y el beneficio de monopolio será por tanto ¼. • El equilibrio de competencia en precios del juego de etapa de Bertrand es P = c = 0 (nula diferencia entre precio y coste medio), la cantidad producida total será 1, y el beneficio de cada empresa 0. • Las empresas ganarán más en un acuerdo de cartel que en el equilibrio del juego de etapa, la desviación máxima que pueden obtener es beneficio de monopolio de un período 1/4 COMPETENCIA DE BERTRAND Y NUMERO DE EMPRESAS: DESVIACIONES Y DESCUENTO Nº E E Etapa Cartel Desv. Max. P 2 0 0 1/2 1/8 (1/2)- 1/4 0,50 3 0 0 ½ 1/12 (1/2)- ¼ 0,66 4 0 0 1/2 1/16 (1/2)- ¼ 0,75 5 0 0 1/2 1/20 (1/2)- ¼ 0,80 ... ... … ... N 0 0 1/2 ... P ... P ... ... 1/4N (1/2)- 1/4 (N-1)/N 10 COMPETENCIA DE COURNOT: EQUILIBRIOS Y DESVIACIONES • Normalizando a 1 el tamaño del mercado y a cero los costes, la función de precios de venta resulta: P=1-Q • Los equilibrios del juego de etapa en función del número de empresas son: – a) Cantidades individuales qi*=1/(N+1), – b) Cantidad total Q*=N/(N+1), – c) Precio P=1/(N+1), – d) Beneficio i=1/(N+1)2 • En un acuerdo de cártel la producción total y el precio serán los de monopolio (1/2), las producciones individuales serán la enésima parte: qiM=1/2.N. COMPETENCIA DE COURNOT: EQUILIBRIOS Y DESVIACIONES CONTINUACION El mejor pago que resulta de de desviarse del acuerdo colusivo (desviación máxima) resultará: max qi (1 qi QMi ) max qi (1 qi qid N 1 ) Lo que implica : 2.N N 1 4.N La mejor desviación será en consecuenc ia : N 1 N 1 di q (1 q ) 2.N 4.N d i 2 d i 11 COMPETENCIA DE COURNOT Y NUMERO DE EMPRESAS: DESVIACIONES Y DESCUENTO Nº E. E. ETAPA q p CARTEL q p DESV. MAX. q p 2 3 4 5 6 ... 1/3 1/3 0,111 1/4 1/2 0,125 3/8 3/8 0,141 0,529 1/4 1/4 0,063 1/6 1/2 0,083 4/12 4/12 0,111 0,571 1/5 1/5 0,040 1/8 1/2 0,063 5/16 5/16 0,098 0,609 1/6 1/6 0,028 1/10 1/2 0,050 6/20 6/20 0,090 0,642 1/7 1/7 0,020 1/12 1/2 0,042 7/28 7/28 0,085 0,671 ... ... N ... ... ... 1 1 1 1 2 N 1 N 1 ( N 1) 2 N 1 2 ... 1 4N ... ... ... ... N 1 N 1 N 1 d c 4N 4 N 4.N d e 2 COLUSION EN EL MODELO DE COURNOT: GRAN NUMERO EMPRESAS Nº Empresas 2 5 10 15 20 25 50 100 250 500 1000 d 0,1406 0,0900 0,0756 0,0711 0,0689 0,0676 0,0650 0,0638 0,0630 0,0628 0,0626 x 0,1250 0,0500 0,0250 0,0167 0,0125 0,0100 0,0050 0,0025 0,0010 0,0005 0,0003 e 0,1111 0,0278 0,0083 0,0039 0,0023 0,0015 0,0004 0,0001 0,0000 0,0000 0,0000 delta 0,529 0,643 0,752 0,810 0,846 0,871 0,929 0,962 0,984 0,992 0,996 12