Quand les stratégies d'équilibre

Les équilibres de Nash ne sont généralement pas calculables. Un équilibre -Nash est un ensemble de stratégies où, compte tenu des stratégies des adversaires, chaque joueur obtient à moins de du gain maximum possible. Trouver un équilibre -Nash, étant donné et un jeu, est -complete. $\epsilon$ $\epsilon$ $\epsilon$ $\epsilon$ $\mathsf{PPAD}$

En suivant strictement les définitions, il ne semble pas y avoir de raison particulière de croire que les stratégies d'un équilibre Nash donné soient proches des stratégies de tout équilibre Nash. Cependant, nous voyons souvent la littérature utiliser un peu maladroitement une expression comme "calculer approximativement un équilibre de Nash" quand cela signifie dire "calculer un équilibre de Nash approximatif". $\epsilon$

Donc, je me demande quand le second implique le premier; c'est-à-dire, pour quels jeux peut-on s'attendre à ce que les équilibres -Nash soient "proches" des équilibres Nash? $\epsilon$

Plus formellement, supposons que j'ai un jeu sur joueurs et une séquence de profils de stratégie . $n$ $(s_1^{(1)},\dots,s_n^{(1)}), (s_1^{(2)},\dots,s_n^{(2)}), (s_1^{(3)},\dots,s_n^{(3)}), \dots$

Chacun est un équilibre -Nash, et la séquence converge vers zéro. $(s_1^{(i)},\dots,s_n^{(i)})$ $\epsilon_i$ $\epsilon_1,\epsilon_2,\epsilon_3,\dots$

Mes questions:

Quand (dans quelles conditions / hypothèses) toutes les stratégies convergent-elles? C'est-à-dire que pour chaque joueur , convergent nécessairement. $j$ $s_j^{(1)},s_j^{(2)},s_j^{(3)},\dots$
Dans quelles conditions supplémentaires la limite de cette séquence est-elle réellement un équilibre de Nash du jeu? (Il me semble qu'aucune autre hypothèse ne devrait être nécessaire; c'est -à- dire que si toutes les stratégies convergent, la limite devrait être un NE.)
Quand est- ce un algorithme de calcul -Nash équilibres impliquent nécessairement un algorithme de calcul de stratégies d'environ un équilibre de Nash? Les conditions ci-dessus sont-elles suffisantes? $\epsilon$

Merci beaucoup!

Modifier 2014-03-19

Après avoir lu la référence dans la réponse de Rahul, il semble plus raisonnable de penser en termes de distances entre les distributions plutôt que de séquences convergentes. Je vais donc essayer de reformuler les questions et aussi de faire quelques réflexions récentes. $\ell_1$

(Eh bien, cela dépend trop de l'algorithme pour vraiment avoir une réponse. Sans restrictions sur l'algorithme, vous pouvez avoir deux équilibres Nash distincts et ensuite, lorsque vous branchez de plus en plus dans l'algorithme, la distance entre les sorties successives pourrait encore être important car les sorties oscillent entre les équilibres.) $\epsilon$ $\ell_1$
$p$ $p$ $\epsilon$ $\|p - q\|_1 \leq \delta$ $q$ $\delta \to 0$ $\epsilon \to 0$ $1$

C'est en fait délicat parce que dans le cadre de la complexité, ce que nous appelons un "jeu" est en fait une séquence de jeux paramétrée par , le nombre de stratégies pures ("actions"). Donc comme , et les taux relatifs comptent. Voici un contre-exemple simple pour montrer que la réponse n'est pas "tous les jeux". Supposons que nous fixons une séquence de décroissants . Ensuite, pour chaque , construisez le jeu à deux joueurs sur actions où, si un joueur joue la première action, il obtient un gain de indépendamment de ce que joue l'autre joueur; si un joueur joue la deuxième action, il obtient un gain de $n$ $n \to \infty$ $\epsilon \to 0$ $\epsilon_1,\epsilon_2,\dots$ $\epsilon_n$ $n$ $1$ $1-\epsilon_n$ indépendamment de ce que joue l'autre joueur; et si un joueur joue une autre action, il obtient un gain de indépendamment de ce que joue l'autre joueur. $0$

Ainsi, chaque jeu a un -equilibrium (les deux jouent la deuxième action) qui est au maximum loin dans distance de son seul équilibre de Nash (les deux jouent la première action). $n$ $\epsilon_n$ $\ell_1$

Donc, deux sous-questions intéressantes:
1. Pour un jeu fixe et fixe , que ce soit pour "assez petit" la condition ci-dessus est vérifiée (tous les -equilibria sont proches des équilibres de Nash). $n$ $\epsilon$ $\epsilon$
2. Peut-être la même question essentiellement, mais si la condition tient si les différences de gains sont limitées par une constante comme . $n \to \infty$
Même question que (2), mais relative aux équilibres réels calculés par des algorithmes. Je suppose que nous obtiendrons probablement des réponses algorithmiques / constructives ou aucune du tout, donc la distinction n'a pas beaucoup d'importance.

reference-request gt.game-theory ppad

— usul
source

Il y a toujours un point limite vers lequel converge une sous-séquence des équilibres epsilon, et cette limite serait un équilibre de Nash exact. Ceci est impliqué par la compacité de l'espace des profils de stratégies mixtes et la continuité des fonctions d'utilité en fonction des probabilités de stratégies mixtes.

(s_{1}^{*} . . . s_{n}^{*})

$(s_1^* ... s_n^*)$

— Noam

L'article suivant formalise au moins la notion d'équilibres approximatifs proches des équilibres exacts et prouve certains résultats structurels connexes.

Pranjal Awasthi, Maria-Florina Balcan, Avrim Blum, Or Sheffet et Santosh Vempala (2010). Sur les équilibres de Nash des jeux stables par approximation. Dans Actes de la troisième conférence internationale sur la théorie des jeux algorithmiques (SAGT'10), 78-89.

En particulier, le document donne un exemple d'une classe de jeux pour la question 3.

— Rahul Savani
source

Merci! Je suppose que c'est l'état de l'art. J'ajouterai également quelques réflexions dans ma question.

— usul