Quand les stratégies d'équilibre


9

Les équilibres de Nash ne sont généralement pas calculables. Un équilibre -Nash est un ensemble de stratégies où, compte tenu des stratégies des adversaires, chaque joueur obtient à moins de ϵ du gain maximum possible. Trouver un équilibre ϵ -Nash, étant donné ϵ et un jeu, est P P A D -complete.ϵϵϵϵPPAD

En suivant strictement les définitions, il ne semble pas y avoir de raison particulière de croire que les stratégies d'un équilibre Nash donné soient proches des stratégies de tout équilibre Nash. Cependant, nous voyons souvent la littérature utiliser un peu maladroitement une expression comme "calculer approximativement un équilibre de Nash" quand cela signifie dire "calculer un équilibre de Nash approximatif".ϵ

Donc, je me demande quand le second implique le premier; c'est-à-dire, pour quels jeux peut-on s'attendre à ce que les équilibres -Nash soient "proches" des équilibres Nash?ϵ


Plus formellement, supposons que j'ai un jeu sur joueurs et une séquence de profils de stratégie ( s ( 1 ) 1 , , s ( 1 ) n ) , ( s ( 2 ) 1 , , s ( 2 ) n ) , ( s ( 3 ) 1 , , s ( 3 ) n ) , .n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

Chacun est un équilibre ϵ i -Nash, et la séquence ϵ 1 , ϵ 2 , ϵ 3 , converge vers zéro.(s1(i),,sn(i))ϵiϵ1,ϵ2,ϵ3,

Mes questions:

  1. Quand (dans quelles conditions / hypothèses) toutes les stratégies convergent-elles? C'est-à-dire que pour chaque joueur , s ( 1 ) j , s ( 2 ) j , s ( 3 ) j , convergent nécessairement.jsj(1),sj(2),sj(3),

  2. Dans quelles conditions supplémentaires la limite de cette séquence est-elle réellement un équilibre de Nash du jeu? (Il me semble qu'aucune autre hypothèse ne devrait être nécessaire; c'est -à- dire que si toutes les stratégies convergent, la limite devrait être un NE.)

  3. Quand est- ce un algorithme de calcul -Nash équilibres impliquent nécessairement un algorithme de calcul de stratégies d'environ un équilibre de Nash? Les conditions ci-dessus sont-elles suffisantes?ϵ

Merci beaucoup!


Modifier 2014-03-19

Après avoir lu la référence dans la réponse de Rahul, il semble plus raisonnable de penser en termes de distances entre les distributions plutôt que de séquences convergentes. Je vais donc essayer de reformuler les questions et aussi de faire quelques réflexions récentes.1

  1. (Eh bien, cela dépend trop de l'algorithme pour vraiment avoir une réponse. Sans restrictions sur l'algorithme, vous pouvez avoir deux équilibres Nash distincts et ensuite, lorsque vous branchez de plus en plus dans l'algorithme, la distance 1 entre les sorties successives pourrait encore être important car les sorties oscillent entre les équilibres.)ϵ1

  2. ppϵq δ 0 ϵ 0 1pq1δqδ0ϵ01

    C'est en fait délicat parce que dans le cadre de la complexité, ce que nous appelons un "jeu" est en fait une séquence de jeux paramétrée par , le nombre de stratégies pures ("actions"). Donc comme , et les taux relatifs comptent. Voici un contre-exemple simple pour montrer que la réponse n'est pas "tous les jeux". Supposons que nous fixons une séquence de décroissants . Ensuite, pour chaque , construisez le jeu à deux joueurs sur actions où, si un joueur joue la première action, il obtient un gain de indépendamment de ce que joue l'autre joueur; si un joueur joue la deuxième action, il obtient un gain den ϵ 0 ϵ 1 , ϵ 2 , ϵ n n 1 1 - ϵ n 0nnϵ0ϵ1,ϵ2,ϵnn11ϵnindépendamment de ce que joue l'autre joueur; et si un joueur joue une autre action, il obtient un gain de indépendamment de ce que joue l'autre joueur.0

    Ainsi, chaque jeu a un -equilibrium (les deux jouent la deuxième action) qui est au maximum loin dans distance de son seul équilibre de Nash (les deux jouent la première action).ϵ n 1nϵn1

    Donc, deux sous-questions intéressantes:

    1. Pour un jeu fixe et fixe , que ce soit pour "assez petit" la condition ci-dessus est vérifiée (tous les -equilibria sont proches des équilibres de Nash).ϵ ϵnϵϵ
    2. Peut-être la même question essentiellement, mais si la condition tient si les différences de gains sont limitées par une constante comme .n
  3. Même question que (2), mais relative aux équilibres réels calculés par des algorithmes. Je suppose que nous obtiendrons probablement des réponses algorithmiques / constructives ou aucune du tout, donc la distinction n'a pas beaucoup d'importance.


Il y a toujours un point limite vers lequel converge une sous-séquence des équilibres epsilon, et cette limite serait un équilibre de Nash exact. Ceci est impliqué par la compacité de l'espace des profils de stratégies mixtes et la continuité des fonctions d'utilité en fonction des probabilités de stratégies mixtes. (s1...sn)
Noam

Réponses:


5

L'article suivant formalise au moins la notion d'équilibres approximatifs proches des équilibres exacts et prouve certains résultats structurels connexes.

Pranjal Awasthi, Maria-Florina Balcan, Avrim Blum, Or Sheffet et Santosh Vempala (2010). Sur les équilibres de Nash des jeux stables par approximation. Dans Actes de la troisième conférence internationale sur la théorie des jeux algorithmiques (SAGT'10), 78-89.

En particulier, le document donne un exemple d'une classe de jeux pour la question 3.


Merci! Je suppose que c'est l'état de l'art. J'ajouterai également quelques réflexions dans ma question.
usul
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.