Équilibre bayésien parfait


8

On m'a posé une question qui me pose problème:

Prenez le jeu standard Dilemma du prisonnier et considérez qu'il est joué deux fois. (Les joueurs observent le résultat du premier match avant de jouer le second). Considérez les croyances en termes de nœud de joueur 2 dans leur ensemble d'informations.

Trouvez un équilibre bayésien parfait faible (stratégies et croyances) où les stratégies ne sont pas un équilibre parfait de sous-jeu.

Donc, dans le dilemme du prisonnier:

(Defect, Defect) est un nash unique et l'est également l'équilibre parfait du sous-jeu unique.

Mais comment obtenir un faible équilibre bayésien parfait qui n'implique pas de défaut? C'est sûrement strictement dominant. . .

La question est-elle fausse?

Il continue ensuite à demander des équilibres séquentiels (où nous considérons la séquence de stratégies mixtes).

Cette question est-elle erronée ou ai-je mal compris ces concepts?


Cela ne répond pas à la question mais fournit simplement un point pédant. . . En fait, la stratégie doit comprendre 5 éléments.
Brian

Compte tenu de votre commentaire, je pense maintenant que votre problème se situe ailleurs: si vous choisissez une stratégie dominée dans un sous-jeu qui est hors de la trajectoire d'équilibre (donc une qui ne se produit pas réellement), votre gain ne diminue pas.
Giskard

Je comprends donc que les croyances hors du chemin de l'équilibre peuvent être arbitraires (et ne doivent donc pas être conformes à la mise à jour bayésienne) mais j'ai l'impression que la rationalité séquentielle doit tenir (c'est-à-dire, étant donné ces croyances, l'individu doit jouer). leur meilleure stratégie). Donc, en réponse à votre suggestion, une stratégie dominée ne violerait-elle pas la rationalité séquentielle?
Brian

3
@denesp: Le PBE faible est "faible" non pas parce qu'il ne nécessite pas de rationalité séquentielle hors chemin d'équilibre, mais parce qu'il ne nécessite pas de croyances pour être cohérent avec la règle de Bayes hors chemin d'équilibre. Bien que je convienne que dans le cas d'un dilemme (PD) de prisonnier répété deux fois, il n'y a pas de WPBE avec des stratégies parfaites non liées à un sous-jeu, cette conclusion ne tient pas en général. La raison en est que le défaut est une stratégie strictement dominante en DP, donc pour toute croyance hors trajectoire d'équilibre (même si elle n'est pas cohérente avec la règle de Bayes), le défaut est toujours rationnellement séquentiel.
Herr K.

1
Cependant, pour les jeux sans stratégie dominante, nous pourrions manipuler les croyances hors équilibre de manière à rendre les stratégies parfaites non liées aux sous-jeux pour être séquentiellement rationnelles. Si nous renforçons l'exigence de cohérence sur les croyances (telles que celles requises en équilibre séquentiel) en forçant la règle de Bayes à maintenir l'équilibre, alors nous pouvons exclure les stratégies parfaites hors sous-jeu. Ainsi, nous avons le résultat que l'équilibre séquentiel implique à la fois WPBE et SPE.
Herr K.

Réponses:


2

Que la stratégie du joueur 1 soit représentée par où est l'action du premier tour du joueur 1, est l'action prise à l'ensemble d'informations où les deux joueurs ont fait défection au premier tour, est l'action prise dans l'ensemble d'informations où le joueur 1 a fait défection et le joueur 2 a coopéré au tour 1, etc. Notez que quelque chose comme (avec(x11,xDD1,xDC1,xCD1,xCC1)x1xDD1xDC1(x11,x21)x21étant l'action prise au tour 2) n'est jamais une spécification complète de la stratégie du joueur 1, car nous devons spécifier le comportement à chaque ensemble d'informations séparément. Définissez les stratégies du joueur 2 de la même manière. Cependant, un équilibre bayésien parfait doit également spécifier les croyances du joueur, . Il s'agit d'une partie importante de la spécification d'un équilibre. Comme nous le verrons ci-dessous, la question vise à comprendre qu'un équilibre différent ne nécessite pas que les stratégies diffèrent. Une différence de croyances suffit pour compter comme un équilibre différent.μ1,μ2

L'équilibre parfait est donné par: pour le joueur 1 et pour le joueur 2, où et sont des croyances cohérentes dans tous les ensembles d'informations.((D,D,D,D,D),μ1)((D,D,D,D,D),μ2)μ1μ2

Comme cela a été noté dans les commentaires, puisque le "défaut" est une stratégie dominée indépendamment des croyances, même dans un équilibre bayésien parfait faible, les profils de stratégie doivent être pour les deux joueurs. Cependant, ce qui suit est maintenant aussi un équilibre de Nash bayésien parfait faible: et avec , cohérent sur la trajectoire d'équilibre.(D,D,D,D,D)((D,D,D,D,D),μ1)((D,D,D,D,D),μ2)μ1μ2

Ainsi, la question n'est pas fausse, elle montre simplement que deux équilibres de Nash bayésiens parfaits faibles peuvent avoir des stratégies identiques tant qu'ils diffèrent dans les croyances en dehors de la trajectoire d'équilibre.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.