Teoria de la decision y de los juegos



Teoria de los juegos

Teoria de los juegos

Teoria de los juegos

La Teoría de los Juegos proporciona una metodología para el estudio de los problemas de decisión multipersonal; es decir, para el estudio de las situaciones de decisión interactiva en las acciones de cada individuo (dentro de un grupo) tienen consecuencias sobre el bienestar de todos los individuos del grupo.

En estas situaciones, a las que en adelante nos referimos como juegos, los individuos se enfrentan a dos tipos de incertidumbre: una incertidumbre exógena, asociada con elementos aleatorios fuera de su control, y otra incertidumbre endógena, consecuencia del desconocimiento que cada individuo tiene sobre los efectos de las acciones que vayan a adoptar los demás individuos.

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 0 Teoria de la decision y de los juegos

Juegos cooperativos y no cooperativos

El tratamiento de un juego requiere distinguir entre aquellas en las que los individuos tienen la posibilidad de alcanzar acuerdos “contractuales” por los que se comprometen a realizar determinadas acciones, de aquellas en las que los acuerdos contractuales no son posibles. Las primeras son objeto de estudio de la Teoría de los Juegos cooperativos, cuyo tema central es el estudio de propuestas alternativas de reparto de las ganancias que se derivan de la cooperación.

La Teoría de los Juegos no cooperativos estudia situaciones en las que los individuos no pueden contratar sus acciones, yo sea porque no exista una autoridad externa que garantice el cumplimiento de los contratos (como ocurre, por ejemplo, con las relaciones comerciales, políticas, etc., entre estados soberanos), o porque las acciones involucren derechos inalienables (que impiden, por ejemplo, que un trabajador renuncie a su derecho a rescindir su relación laboral con una empresa), o porque involucren acciones consideradas ilegales (como, por ejemplo, los acuerdos para la fijación de precios entre empresas o los acuerdos de reparto de territorio entre mafiosos), o porque no sean observables (que imposibilita la compra-venta de votos o resta credibilidad a declaraciones de “invulnerabilidad a la corrupción” — ja ja).

Los juegos no cooperativos se caracterizan por la presencia de una mezcla de intereses conflictivos y de posibilidades de cooperación que dificultan su tratamiento. Estas notas se dedican a una breve presentación de la teoría básica de los juegos no cooperativos.

Juegos estáticos y dinámicos: forma normal y extensiva

Como en los problemas de decisión individual, en el tratamiento de los juegos no cooperativos conviene distinguir entre juegos estáticos y juegos dinámicos.

Los juegos estáticos son aquellos en los que los jugadores adoptan acciones de forma simultánea o cuando, aunque no se realicen de forma simultánea, no son directamente observables. En estos juegos, los jugadores deciden sus acciones sobre la base de la información disponible inicialmente y durante el proceso de toma de decisiones no se genera información adicional. Ejemplos de este tipo de juegos son las elecciones por voto secreto,

Los juegos dinámicos se caracterizan por que en el proceso de toma de decisiones los jugadores reciben nueva información, que puede ser información acerca de acciones adoptadas por otros jugadores (o por uno mismo) o resultados de movimientos de azar. Ejemplos

Como los problemas de decisión individual, los juegos pueden representarse en forma normal (una representación análoga a la matriz de pagos en problemas de decisión individual) o en forma extensiva (análoga a los árboles de decisión). Cualquier juego puede representarse en un formato u otro. Sin embargo, mientras que la forma normal es una representación económica y precisa de un juego estático, no lo es de un juego dinámico, sino que, como veremos, la representación en forma normal proporciona una información deficiente de un juego dinámico.

Juegos Estáticos: forma normal

Los elementos que describen un juego en forma normal G son

  • Un conjunto de jugadores N ={1,…,n}.
  • Un conjunto de acciones o estrategias posibles Si para cada jugador i∈ N.
  • Una función de utilidad (esperada) sobre los perfiles de acciones posibles (s1,…,sn)∈ S =S1 ×···×Sn,ui :S → R, para cada jugador i∈ N.

Así, un juego en forma normal esta descrito por una terna (N,S,u).

Ejemplos

Ejemplo 1 (Pares/Nones). En este juegos dos individuos eligen simultáneamente un número par o impar (non) (“sacan dedos”); si la suma es par (non), el Jugador 2

(1) paga un euro al Jugador 1 (2). Este juego puede representarse en forma normal como G =(N,S,u), donde N ={1,2}, ypara i ∈ N, Si ={Pi,Ni} (P por “par” e N por “non”) y 1=u1(P1,P2)=u1(N1,N2)=−u2(P1,P2)=−u2(N1,N2)= −u1(P1,N2)=−u1(N1,P2)=u2(P1,N2)=u2(N1,P2). Esta información puede describirse de forma compacta mediante la siguiente tabla:

P2 N2

P1 N1

1,−1 −1,1
−1,1 1,−1

En la tabla la fila representan la estrategia elegida por el del Jugador 1 y la columna la elegida por el Jugador 2. Para cada perfil de estrategias (fila, columna), el primer (segundo) número de cada casilla representa la utilidad esperada del Jugador 1 (2). En lossiguientesejemplosmantenemosestaconvención.

Ejemplo 2 (Dilema del Prisionero). Dos individuos son detenidos e incomunicados. La policía sospecha que estos individuos han cometido un delito grave (penado con 4 años de cárcel), aunque sólo dispone de pruebas para condenarles por un delito menor (penado con 1 año de cárcel). La policía propone a cada preso el mismo trato: si delata a su compañero (D) quedará libre (y por supuesto éste será condenado a 4 años de cárcel). Si ambos se acusan mutuamente, la pena se reduciría de 4 a 3 años (para cada uno), mientras que si ambas guardan silencio (es decir, si “cooperan” entre ellos, C) entonces, con la evidencia circunstancial de que dispone la policía sólo podrían ser condenados a un año de cárcel. Este juego puede representarse en forma normal mediante la siguiente tabla:

C2 D2

.

C1 D1

−1, −1 −4, 0
0, −4 −3, −3

Ejemplo 3 (Batalla de los Sexos). Alberto y Bea quieren salir juntos, pero discrepan sobre a donde ir. Alberto es un gran aficionado al ballet, mientras que Bea prefiere el fútbol. Dadas sus preferencias, a la hora de decidir a dónde ir se enfrentan al juego representado en la siguiente tabla:

F2 B2

.

F1 B1

1, 2 0, 0
0, 0 2, 1

Ejemplo 4 (Coordinación). Dos napolitanos aparcan sus coches en el mismo garaje y con frecuencia coinciden al entrar o salir. En varias ocasiones han coincidido y hasta ahora han tenido suerte. Sin embargo, son conscientes del riesgo, así que han decidido discutir un acuerdo sobre si circular por la derecha (D) o por la izquierda

(I) al entrar y salir del garaje. El juego al que se enfrentan está representado en la siguiente tabla:

D2 I2

D1 I1

1, 1 0, 0
0, 0 1, 1

Los ejemplos 1-4 representan situaciones en las que las posibilidades de cooperación y conflicto de intereses están mezcladas de manera inextricable. Estos dos ingredientes, cooperación u conflicto, están presenten, en distinto grado, en cualquier juegonocooperativo. Elconflicto de intereses es extremo en el Ejemplo 1, muy intenso en el Ejemplo 2, y también está presente, aunque en menor medida, en el 3; sin embargo, está ausente en el Ejemplo 4. Las posibilidades de cooperación son crecientes en los ejemplos 2, 3 y 4, mientras que son inexistentes en el Ejemplo 1.

El Ejemplo1 pertenecea una clasedejuegos quesedenominan de suma cero

o estrictamente competitivos. En estos juegos los intereses de los jugadores son diametralmente opuestos: en cada circunstancia posible, las ganancias de cada jugador son pérdidas del oponente. Obviamente, los juegos de suma cero representan situaciones de puro conflicto. Estas situaciones son relativamente infrecuentes en problemas económicos.

El Ejemplo 2 representa un juego recurrente en situaciones económicas: aunque existen amplias posibilidades de cooperación, la existencia de ganancias substanciales derivadas de la desviación del comportamiento cooperativo impiden que este se materialice. Como veremos, la competencia entre empresas o la provisión de bienes públicos son ejemplos de este tipo de situaciones.

2.2 Racionalidad e Información

Las propuestas de solución que se presentan a continuación están justificadas bajo dos hipótesis fundamentales sobre la conducta de los individuos y su información básica. Estos hipótesis son:

Racionalidad. El objetivo de cada individuo es maximizar su bienestar.

Esta hipótesis no excluye la posibilidad de que el bienestar de un individuo dependa de la situación de otros individuos y, por tanto, admite la posibilidad de comportamientos tanto individualistas como altruistas. Ahora bien, cualquier consideración sobre el bienestar de los demás debe estar recogida expresamente en la función de utilidad esperada de cada jugador.

Conocimiento. El hecho de que los individuos son racionales es de conocimiento público; es decir, todos lo saben, todos saben que todos lo saben, todos saben que todos saben que todos lo saben, …(ad infinitum).

Soluciones a Juegos Estáticos

Predecir el comportamiento de los jugadores de un juego estático requiere identificar un perfil de estrategias o acciones y, por tanto, identificar indirectamente el resultado del juego. Proponemos dos conceptos de solución para los juegos estáticos no cooperativos: el conjunto de estrategias racionalizables y el conjunto de equilibrios de Nash.

Estrategias Racionalizables

En esta primera aproximación formulamos un concepto de solución que se basa no tanto en identificar positivamente la conducta de los jugadores, como en eliminar de nuestra consideración aquellas acciones que definitivamente no son compatibles con las hipótesis de racionalidad y conocimiento común y que, por tanto, no cabe esperar que se adopten. Para formalizar este concepto necesitamos primero introducir la noción de estrategia estrictamente dominada.

Informalmente, una estrategia está estrictamente dominada si existe otra estrategia posible que es uniformemente mejor, es decir, que proporciona al jugador un pago mayor cualesquiera que sean las estrategias de los demás jugadores. Obviamente, un jugador racional nunca utilizará una estrategia estrictamente dominada, puesto que esta conducta sería inconsistente con nuestro postulado de que los jugadores adoptan siempre aquellas acciones que maximizan su bienestar. Obsérvese que en esta descripción hemos considerado cualquier perfil estrategias de los demás jugadores como posible. Sin embargo, la noción de estrategia estrictamente dominada debería formularse respecto a los al conjunto de perfiles de estrategias para los demás jugadores que el jugador cree que podrían adoptarse. Por ello, formulamos la noción de estrategia dominado respecto a un conjunto dado de perfiles de estrategias de los demás jugadores.

Consideramos en juego en forma normal G =(N,S,u). Recordemos que S = S1 ×S2 ×··· ×Sn es el conjunto de perfiles de estrategias posibles. Usaremos la notación s =(s1,s2,…,sn);asimismo, para i ∈ N escribiremos s =(si,s−i), donde si Si =S1 ×···Si−1 ×Si+1 ···×Sn es un perfil de estrategias que especifica una acción para cada jugador excepto el i.

Estrategias estrictamente dominadas.Sea Sˆ=Sˆ1 ×Sˆ2 ×···×Sˆn, donde Sˆi ⊆ Si. Decimos que la estrategia si ∈ Sˆi está estrictamente dominada respecto a Sˆsi existe s0 i ∈ Sˆi tal que para todo si Sˆi tenemos ui(si0 ,s−i)>ui(si,s−i).

Como ya hemos discutido, el uso estrategias estrictamente dominadas (respecto a S) es inconsistente con la hipótesis de racionalidad. Por tanto, estas estrategias pueden ser eliminadas como estrategias posibles. Pero puesto que este hecho puede ser inferido por cualquier jugador que sepa que los jugadores son racionales, tenemos que llevar este argumente hasta sus últimas consecuencias, ya que es posible que una vez eliminadas las estrategias estrictamente dominadas respecto a S, aparezcan, sucesiva mente, nuevas estrategias estrictamente dominadas. Para proporcionar un concepto de solución consistente con la hipótesis de que la racionalidad es un hecho de conocimiento público, hemos de eliminar iterativamente todas las estrategias estrictamente dominadas. A continuación se formaliza este procedimiento de eliminación.

Estrategias racionalizables.Definimos la secuencia {S0,S1,…,Sk ,…}de perfiles de estrategias que sobreviven a la eliminación iterativa de estrategias estrictamente dominadas. Sea S0 =S,ypara k =1,2,…,definimos el conjunto Sk =S1 k×S2 k×···× Snk ,donde para cada i∈ N,Sik es el conjunto de estrategias que no están estrictamente dominadas respecto a Sk1 . Así, la secuencia {Sk} se obtiene eliminando en cada iteración las estrategias estrictamente dominadas respecto al conjunto de estrategias no eliminadas en etapas anteriores. Por tanto, cada elemento de la sucesión está contenido en el anterior: S0 ⊇ S1 ⊇ ··· ⊇ Sk1 Sk ⊇ …, de manera quesetrata de una sucesión decreciente. El conjunto de perfiles de estrategias racionalizables Ses el límite de esta sucesión, que podemos calcular como

\

SSk

= .

k=0

Propiedades de S. Las dos propiedades básicas del conjunto Sson

1. S

=∅, y

2. Si el conjunto de perfiles de estrategias es finito entonces puede calcularse en un número finito de iteraciones; es decir, existe k¯tal que S=Sk¯.

La primera propiedad es consecuencia del siguiente hecho: para que haya una estrategia estrictamente dominada debe haber otra que la domine. Por tanto, todos los conjuntos de la secuencia {S0,S1,…,Sk ,…} son no vacíos.

La segunda propiedad es consecuencia del hecho de que si en alguna iteración

= Sk+1

tenemos Sk entonces la secuencia se hace constante, con lo que tenemos S=Sk . Por tanto, el número máximo de iteraciones necesarios para calcula Ses igual al numero de perfiles de estrategias contenidos en S menos n (porque al menos una estrategia para cada jugador sobrevive a la eliminación iterativa).

Cálculo de S. Para calcular el conjunto de estrategias racionalizables de un juego G=(N,S,u)conviene seguir el siguiente procedimiento:

  1. Eliminar las estrategias estrictamente dominadas de cada jugador identificando el conjunto S1.
  2. Considerar ahora el juego reducido que resulta de eliminar los perfiles de estrategias que no están en S1 y sus correspondientes pagos. Identificar las estrategias estrictamente dominadas en este nuevo juego.

¯

3. Continuar este proceso hasta que en alguna iteración k no se encuentren estrategias estrictamente dominadas. El conjunto Scoincide con Sk¯.

A continuación aplicamos este procedimiento para encontrar el conjunto de es

trategias racionalizables en varios ejemplos. Ejemplos: En los ejemplos 1-4 el conjunto Sse puede calcular fácilmente: en los ejemplos 1, 3 y 4 tenemos S= S, pues ninguna estrategia está estrictamente dominada respecto a S. En el Ejemplo 2, las estrategia C1 y C2 están estrictamente dominadas en S ypor tanto S= {(D1,D2)}.

A continuación presentamos un ejemplo en el que el cálculo del conjunto Srequiere varias etapas de eliminación de estrategias estrictamente dominadas. Ejemplo 5. Consideremos el siguiente juego en forma normal:

A2 B2 C2

A1 B1 C1

1,1 0,0 −1, 0
0,0 0,6 10, −1
2,0 10, −1 −1, −1
  1. Cálculo de S1: C2 está estrictamente dominada (por A2); no hay ninguna otra estrategia estrictamente dominada para ningún jugador. Por tanto S11 = S, S1 = {A2,B2}.
  2. El juego (N, S1,u) es A2 B2

2

A1 B1 C1 .

1, 1 0, 0
0, 0 0, 6
2, 0 10,−1

Las estrategias A1 y B1 están estrictamente dominadas (por C1). No hay ninguna estrategia estrictamente dominada para el Jugador 2. Por tanto, S2 = {C1}, y

1 S2 = S1 = {A2,B2}.

22

3. El juego (N, S2,u) es A2 B2

2, 0 10, −1

.

C1 En este juego la estrategia B2 está estrictamente dominada (por A2). Por tanto, S3 = {C1}, y S3 = {A2}.

12

4. El juego (N, S3,u) es A2

.

2, 0

C1

En este juego no hay estrategias estrictamente dominadas. Por tanto, S4 = S3 .

Consiguientemente, para k ≥ 3,Sk = S3 = S= {(C1,A2)}.

Equilibrio de Nash

El conjunto Ses un conjunto generalmente grande. De hecho, con frecuencia (como muestran los ejemplos 1, 3 y 4) no hay estrategias estrictamente dominadas, de manera que S= S. En este caso, este concepto de solución carece de poder predictivo alguno. Necesitamos, por tanto, un concepto de solución más operativo, que identifique positivamente las estrategias que cabría esperar que adopten los jugadores.

El concepto de equilibrio de Nash1 identifica los perfiles de estrategias que son estables, en el sentido de que ningún jugador quiera desviarse si espera que los demás adopten las acciones que se prescribe para ellos. El equilibrio de Nash indica el desenlace predecible del juego, y puede interpretarse como un “acuerdo” o una “norma” que tiene la propiedad de que es autosostenible: una vez aceptado, ningún jugador tiene incentivos para modificarlo unilateralmente. Otra interpretación interesante contempla al concepto de equilibrio de Nash como perfil de expectativas que se “autoconfirman”, en el sentido de que si los jugadores esperan que los demás se comporten de acuerdo con lo prescrito, entonces estas acciones ocurren como consecuencia de la conducta óptima de los jugadores; es decir, las expectativas de los jugadores son “racionales” porque son consistentes con la conducta racional.

Consideremos un juego en forma normal G =(N, S, u).

1John Nash (1928—), se licenció en matemáticas a los 20 años en el Carnegie Institute of Technology y se doctoró a los 22 años (con una tesis de 27 páginas) en Princeton. Profesor del MIT de Boston, enfermó muy joven y tuvo que abandonar la investigación. Recibió el premio Nobel de economía en 1994.

Equilibrio de Nash. Un equilibrio de Nash (EN) de G es un perfil s =(s 1,…,s n) tal que para cada Jugador i y cada estrategia si ∈ Si tenemos

¡¢

ui (s )≥ ui si,s .

−i

Escribimos EN(G) para denotar el conjunto de equilibrios de Nash del juego G. Como veremos, el conjunto G puede contener más de un elemento (como ocurre en los ejemplos 3 y 4 que discutimos más abajo). También puede ser vacío (como en el Ejemplo 1); trataremos este problema más adelante.



Un equilibrio de Nash se caracteriza por que cada jugador responde óptimamente a las estrategias de los demás jugadores. Esta interpretación permite reformular el concepto de equilibrio de Nash como una solución a un sistema de ecuaciones. Para cada jugador i ∈ N y para cada perfil de estrategias si Si para los demás jugadores, identifiquemos la estrategia que maximiza la utilidad del Jugador i, Ri(s−i). Con frecuencia nos referimos a Ri(s−i)como la mejor respuesta del Jugador ial perfil si –para simplificar, supondremos, por el momento, que la óptima es única, aunque generalmente no lo será. Con esta notación, podemos caracterizar a los equilibrios de Nash como las soluciones al sistema de ecuaciones2

s1 = R1(s−1)

s2 = R2(s−2)

.

.

.

sn = Rn(s−n).

Para mostrar la utilidad de esta formulación para el cálculo de los equilibrios de Nash de un juego, discutimos los ejemplos 1-5. Ejemplos:

1. Consideremos el juego del Ejemplo 1. En la tabla adjunta hemos subrayado la mejor respuesta de cada jugador: por ejemplo, el pago del Jugador 1 subrayado el la posición (1,1) de la matriz indica que la mejor respuesta del Jugador 1 ala estrategia s2 =P2 es P1;análogamente el pago del Jugador 2 subrayado en la posición (1,2)indica quelamejor respuestadel Jugador2alaestrategia

2Puesto que cada jugador puede tener más de una mejor respuesta (es decir, Ri(s−i) puede ser un conjunto en vez de un único punto), el sistema de ecuaciones debería formularse sustituyendo el símbolo de igualdad (=) por el de pertenencia (∈).

s1 =P1 es N2.

P2 N2

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 1 Teoria de la decision y de los juegos

Así, en un equilibrio de Nash los pagos de ambos jugadores deben estar subrayados. Como se observa, esta situación no existe en este juego. Volveremos sobreesteejemplo.

2. Consideremos el Ejemplo 2. En la tabla hemos subrayado las mejores respuestas de los jugadores 1 y 2.

C2 D2 C1 D1

−1,−1 −4,0
0,−4 −3,−3

El único perfil de estrategias que tiene ambos pagos están subrayados es el (D1,D2).Este perfil es el único equilibrio de Nash del juego. Por tanto EN(G)= {(D1,D2)}.

3. Consideremos el Ejemplo 3. En la tabla hemos subrayado las mejores respuestas de los jugadores 1 y 2.

F2 B2

F1 B1

1,2 0,0
0,0 2,1

Existen dos perfiles de estrategias que tienen ambos pagos subrayados, (F1,F2)y (B1,B2).Ambos perfiles son equilibrios de Nash del juego. Por tanto EN(G)= {(F1,F2),(B1,B2)}.

4. Consideremos el Ejemplo 4. En la tabla hemos subrayado las mejores respuestas de los jugadores 1 y 2.

I2 D2 I1 D1

1,1 0,0
0,0 1,1

También en este juego existen dos perfiles de estrategias que tienen ambos pagos subrayados, (I1,I2)y (D1,D2). Por tanto, EN(G)={(I1,I2),(D1,D2)}.

5. Consideremos ahora el Ejemplo 5. En la tabla hemos subrayado las mejores respuestas de los jugadores 1 y 2.

A2 B2 C2

A1 B1 C1

1,1 0,0 −1,0
0,0 0,6 10,−1
2,0 10,−1 −1,−1

En este juego existen un único perfil de estrategias que tiene ambos pagos subrayados, (C1,A2). Por tanto, EN(G)= {(C1,A2)}.

Equilibrios de Nash y estrategias racionalizables. Como ilustran los ejemplos, todo perfil de estrategias de equilibrio de Nash es un perfil de estrategias racionalizable; es decir, EN(G) ⊆ S. Así, el concepto de equilibrio de Nash puede interpretarse como una “propuesta de selección” dentro del conjunto S. El problema es que, como revela el juego de Pares/Nones (Ejemplo 1), existen juegos que no poseen un equilibrio de Nash. Para discutir este problema necesitamos introducir la posibilidad de que los jugadores elijan sus estrategias de acuerdo con un procedimiento aleatorio.

Estrategias Mixtas

El juego de Pares/Nones (Ejemplo 1) carece de un equilibrio de Nash. Por otra parte, nuestra perspectiva sobre el comportamiento de los jugadores en este juego, en concreto nuestro objetivo de predecir qué estrategia adoptará cada jugador, no parece la adecuada. Cualquiera que haya participado en este juego sugeriría que lo que cabe esperar es que los jugadores jueguen Pares o Nones con aproximadamente la misma frecuencia, de manera que lo que se observa es que cada perfildeestrategias se adopte con una frecuencia igual a 1/4. Si un jugador fuese propenso a jugar Pares (o Nones) más frecuentemente que Nones (Pares) y este hecho fuera reconocido por su oponente, perdería con más frecuencia que ganaría. Para evitar la explotación de esta información por parte del rival, cada jugadores debe protegerse eligiendo aleatoriamente su estrategia.

Esta discusión sugiere que debemos considerar la posibilidad de que los jugadores utilicen distribuciones de probabilidad para seleccionar sus acciones. Incluir esta posibilidad supone cambiar nuestra perspectiva sobre el comportamiento de los jugadores. Además, también tenemos que adoptar otra perspectiva sobre el objetivo de predecir este comportamiento: el objetivo de identificar las estrategias que vayan a adoptar los jugadores no es viable ni adecuado. Puesto que los jugadores eligen sus estrategias de manera aleatoria, nuestro objetivo debe ser predecir la distribución de probabilidad sobre los perfiles de estrategia posibles que mejor explica este comportamiento.

Consideremos un juego G =(N,S,u). Una estrategia mixta para el Jugador i ∈ N es un distribución de probabilidad sobre Si. A partir de ahora, nos referiremos a los elementos de Si como estrategias puras. SielJugador i tiene un número finito de estrategias puras, es decir, Si = {si 1,…,s mi }, entonces unaestrategiamixtaes

i un vector σi =(σi 1 ,…,σimi ), donde σik ≥ 0 es la probabilidad con que el jugador adopta la estrategia sik; y puesto que σi es una distribución de probabilidad, tenemos

P mi

σk =1. Obsérvese que la estrategia pura s1 es equivalente a la estrategia mixta

k=1 ii

(1,0,…,0), la si 2 a (0,1,…,0), etcétera, de manera que las estrategias puras son casos particulares de estrategia mixta (son distribuciones de probabilidad degeneradas). El conjunto de estrategias mixtas del Jugador i lo denotamos como Σi, yelconjunto de perfiles de estrategias mixtas como Σ = Σ1 ×···×Σn.

Cada perfil de estrategias mixtas σ ∈ Σ es una lotería sobre el conjunto de perfiles de estrategias puras S. Para cada σ ∈ Σ, la utilidad esperada de cada jugador i ∈ N viene dada por

m1m2mn

XX X

σk1 σk2 k1 k2 kn

Eui(σ)= ··· 12 ···σkn n ui(s1 s2 ···sn ). k1=1 k2=1 kn=1

Ejemplos:

1. En el juego del Ejemplo 1 supongamos que los jugadores eligen las estrategias σ1 =(p,1 − p) y σ2 =(q,1 − q), donde p (q) es la probabilidad con que el Jugador 1 (2) elige P1 (P2).En este caso σ =(σ12) es una lotería que resulta en (P1,P2) con probabilidad pq, (P1,N2) con probabilidad p(1 − q), etcétera. La utilidad esperada del Jugador 1 es, por tanto,

Eu1(σ)= pq(1) + p(1 − q)(−1) + (1 − p)q(−1) + (1 − p)(1 − q)(1) =1 − 2q+2p(2q− 1).

Y puesto que se trata de un juego de suma cero, tenemos

Eu2(σ)= −Eu1(σ)= −1+2p+2q(1 − 2p).

2. En el juego del Ejemplo 3 supongamos que los jugadores eligen las estrategias σ1 =(p,1 − p) y σ2 =(q,1 − q), donde p (q) es la probabilidad con que el Jugador 1 (2) elige F1 (F2).En este caso σ =(σ12) es una lotería que resulta en (P1,P2) con probabilidad pq, (P1,N2) con probabilidad p(1 − q), etcétera. La utilidad esperada del Jugador 1 es

Eu1(σ)= pq(1) + (1 − p)(1 − q)(2) = 2 − 2q + p(3q − 2).

Y la utilidad esperada del Jugador 2 es

Eu2(σ)= pq(2) + (1 − p)(1 − q)(1) = 1 − p + q(3p − 1).

Equilibrio de Nash en estrategias mixtas: La noción de equilibrio de Nash se puede formular fácilmente cuando los jugadores eligen una estrategia mixta, en vez de una pura. Un perfil de estrategias mixtas σes un equilibrio de Nash si para cada i ∈ N ycada σi ∈ Σi tenemos

Euii ,σ ) ≥ Euii).

−i−i

Como en el caso de estrategias puras, denotemos mediante Ri−i) la(s) estrategia(s) (mixta) óptima del cada jugador i ∈ N cuando los demás jugadores utilizan las estrategias mixtas σ−i. Así, un equilibrio de Nash σes una solución al sistema de ecuaciones

σ1 = R1−1) σ2 = R2−2)

.

.

.

σn = Rn−n).

De nuevo esta formulación nos proporciona un definición más operativa, que nos orienta en el cálculo de los equilibrios de Nash de un juego.

Puesto que las estrategias puras pueden también representarse como estrategia mixtas, mantendremos la notación EN(G) para referirnos al conjunto de perfiles de estrategias (mixtas) que constituyen un equilibrio de Nash del juego G. La propiedad más importante de la noción de equilibrio de Nash (en estrategias mixtas) es que todo juego posee un equilibrio. Por supuesto, algunos juegos sólo tienen equilibrios en estrategias mixtas (como ilustra el ejemplo del juego de Pares/Nones que volvemos a discutir a continuación), otros tienen equilibrios en estrategias puras y mixtas (como el juego de la Batalla de los Sexos), y otros sólo en puras (como el Dilema del Priosionero). Ejemplos:

1. En el juego del Ejemplo 1, si los jugadores eligen las estrategias σ1 =(p,1 − p) y σ2 =(q,1 − q), la utilidad esperada del Jugador 1 es

Eu1(p,q)=1 − 2q +2p(2q − 1).

Por tanto, la Eu1(p,q) es (1) creciente en p si q>

1 2

, (2) constante en p si q =

1 2

y (3) decreciente en p si q<

1

2

. En el primer caso, laestrategiaóptimadel

Jugador 1 es p =1, mientras que en el segundo cualquier estrategia es óptima y en el tercero la estrategia óptima es p =0. Así, su función de reacción es

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 2 Teoria de la decision y de los juegos

1 si q>

R1(q)= [0,1] si q =

1

21

2

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 3 Teoria de la decision y de los juegos

1

2

0 si q<

.

Análogamente, la utilidad esperada del Jugador 2 es

Eu2(p,q)= −1+2p +2q(1 − 2p),

ysufuncióndereacción es

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 4 Teoria de la decision y de los juegos

0 si p>

R2(p)= [0,1] si p =

1

21

2

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 5 Teoria de la decision y de los juegos

1

2

1 si p<

.

La única solución al sistema de ecuaciones

p = R1(q) q = R2(p)

©¡

¢ª

es p = q =

1 2

. Por tanto EN(G)=

1111

(

),(

)

,

,

.

2222

2. En el juego del Ejemplo 3, silos jugadores eligen las estrategias σ1 =(p,1 − p) y σ2 =(q,1 − q), la utilidad esperada del Jugador 1 es

Eu1(σ)= pq(1) + (1 − p)(1 − q)(2) = 2 − 2q + p(3q − 2)

ysufuncióndereacción es

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 6 Teoria de la decision y de los juegos

1 si q>

R1(q)= [0,1] si q =

2

32

3

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 7 Teoria de la decision y de los juegos

0 si q<

2

3

.

La utilidad esperada del Jugador 2 es

Eu2(σ)= pq(2) + (1 − p)(1 − q)(1) = 1 − p + q(3p − 1)

y su función de reacción es

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 8 Teoria de la decision y de los juegos

1 si p>

R2(p)= [0,1] si p =

1

31

3

Teoria de la decision y de los juegos   teoria de la decisión y de los juegos img 9 Teoria de la decision y de los juegos

1

3

0 si p<

.

El sistema de ecuaciones
p = R1(q)
q = R1(p)

tienetressoluciones(1) p

∗∗∗

= q =1, (2) p = q =0, y(3) p

1

,q =

2

. Por

=

33

© ¢ª

¡

2112

tanto EN(G)= ((1,0),(1,0)) ,((0,1),(0,1)) ,

(

),(

)

,

,

.

3333

Estrategias mixtas y estrategias racionalizables: una vez que hemos abierto la posibilidad de que los jugadores elijan sus acciones de acuerdo con distribuciones de probabilidad, también tenemos que plantearnos esta posibilidad a la hora de determinar si una estrategia está estrictamente dominada.

Ejemplo 6. Consideremos el siguiente juego en forma normal:

A2 B2 C2

A1 B1 C1

1,1 2,2 0,4
2,2 1,1 2,0
3,3 0,2 4,1

En este juego no hay estrategias estrictamente dominidas de acuerdo con la definición formulada anteriormente. Sin embargo, la estrategia mixta del Jugador 2 σ2 =

.

55

) proporciona unos pagos

88

σ2

5 8(1,1) +3 8(0,4) = (5 8, 17 8)
5 8(2,2) +3 8(2,0) = (16 8, 10 8)
5 8(3,3) +3 8(4,1) = (27 8, 18 8)

A1 B1 C1

Esta estrategia mixta claramente domina a la estrategia B2 A2 B2 C2 σ2

A1 B1 C1 .

1,1 2,2 0,4 (5 8 , 17 8 )
2,2 1,1 2,0 (16 8 , 10 8 )
3,3 0,2 4,1 (27 8 , 18 8 )

Una vez eliminada esta estrategia, la eliminación sucesiva de estrategias dominadas resulta en S= {(C1,A2)}.

Concluimos con una nueva reformulación de la noción de estrategia estrictamente dominada que incorpora la posibilidad de que una estrategia (pura) esté dominada por una mixta. Si Sˆ= Sˆ1 ×Sˆ2 ×···× Sˆn, donde Sˆi ⊆ Si, denotamos mediante Σˆi el conjunto de estrategias mixtas σi ∈ Σ tales que solos las estrategias en Sˆi se adoptan con probabilidad positiva.

Estrategias estrictamente dominadas.Sea Sˆ= Sˆ1 ×Sˆ2 ×···×Sˆn, donde Sˆi ⊆ Si. Decimos que la estrategia si ∈ Sˆi está estrictamente dominada respecto a Sˆsi existe una estrategia mixta σi ∈ Σˆi tal que para todo si Sˆi tenemos Eui(si0 ,s−i) >Eui(si,s−i).

GD Star Rating
loading...
Teoria de la decision y de los juegos, 10.0 out of 10 based on 1 rating





Compartelo con tus amigos!!!

Artículos relacionados:

Comentar


Ashley Madison - Have an affair. Married Dating, Affairs, Married Women, Extramarital Affair