Il s'agit d'un concept très important lorsque le KOTH implique un ensemble de décisions relativement simple, n'implique que quelques acteurs (généralement 2) et est déterministe. Un équilibre de Nash décrit une position «bloquée»: si les deux joueurs ont décidé de leurs deux stratégies, alors les deux joueurs sont effectivement bloqués dans ces positions: l'un ou l'autre joueur changeant de stratégie crée simplement des vulnérabilités supplémentaires.
Des exemples de jeux où les équilibres de Nash sont importants sont:
- Rock-Paper-Scissors (-Lizard-Spock), dans lequel une stratégie "imbattable" est un jeu aléatoire
- Morra , qui a un "spectre" d'équilibres. Peter Taylor a écrit un bon exemple dans sa réponse ici .
- Prisoner's Dilemma, un jeu coopératif remarquable pour avoir un blocage "tout le monde perd"
Comment trouver un équilibre
Trouver un équilibre est en fait assez simple pour la plupart des jeux simples et est souvent assez intuitif. Une tonne de détails sur les différentes méthodes peuvent être trouvées sur Internet. Le concept de base, qui est normalement applicable, est de créer une liste de stratégies possibles que les deux joueurs peuvent utiliser (les options fournies par le jeu). Si une stratégie est "dominée" par une autre, cette stratégie peut être supprimée de la liste et le processus est répété. Par «domination», je veux dire que si la stratégie A donne toujours un résultat égal ou meilleur que la stratégie B, contre toutes les stratégies adverses restantes, alors la stratégie B peut être supprimée de la liste.
Exemple: Rock-Paper-Scissors
RPS a quelque chose appelé un équilibre "mixte", ce qui signifie qu'une distribution est impliquée. Plutôt que de jouer le même coup à plusieurs reprises (ce qui entraînera une défaite rapide), l'équilibre consiste à jouer 1/3 de pierre, 1/3 de papier et 1/3 de ciseaux dans une distribution aléatoire. Si je joue au hasard, mon adversaire ne peut rien faire pour me devancer, point final. Si mon adversaire choisit de ne pas jouer au hasard, cela ne fait que créer une vulnérabilité de sa part.
Les jeux à équilibre mixte sont probablement les plus courants sur PPCG, car ils peuvent prendre de nombreuses formes (le seul jeu intéressant auquel je peux penser avec un équilibre pur est le dilemme du prisonnier). Je dois noter que l'équilibre mixte n'a pas à être uniformément aléatoire , simplement autre chose que de jouer le même coup à chaque fois.
Utilisation de ces informations
L'équilibre Nash d'un jeu représente souvent la «ligne de base» à partir de laquelle vous devez essayer de fonctionner. En RPS, jouer au hasard garantit une place de finition au milieu du peloton. Pour passer au sommet, vous devez commencer à identifier les faiblesses des autres joueurs.
Pour ce faire, vous devez vous en tenir à l'équilibre lorsque vous n'êtes pas sûr des faiblesses de l'adversaire. Une fois que ces faiblesses ont été identifiées (vous avez détecté que votre adversaire n'est pas en équilibre), vous devez alors vous déplacer doucement hors de l'équilibre pour profiter de votre adversaire. Cette action, à son tour, crée des faiblesses de votre part. Vous devez ensuite détecter quand votre adversaire change de stratégie, afin de pouvoir ensuite arrêter l'attaque et reprendre le jeu au hasard.
Détecter la variation de l'équilibre
C'est assez difficile et je ne suis pas un expert. Les variations peuvent prendre plusieurs formes:
- Privilégier certaines options au-dessus / en dessous d'autres sans aucune raison, comme un lecteur RPS qui joue du rock deux fois plus souvent que des ciseaux, ou qui évite de jouer au papier. Certaines statistiques relativement simples peuvent le détecter.
- Baser un mouvement actuel sur les mouvements passés, selon un schéma prévisible. Cela inclut les "copie-chats", les bots "bat ce qui bat votre dernier coup" ou les bots "à vélo". Cela nécessite une logique supplémentaire pour détecter, car la distribution globale des mouvements peut être également répartie, même si les mouvements ne sont pas aléatoires. Vous devriez essayer de prendre le dossier des coups et trouver des corrélations comme "le coup que j'ai fait il y a 2 tours et le coup que mon adversaire a fait maintenant" et "le coup qu'il a fait il y a 1 tour, et le coup qu'il a fait maintenant", etc.
- Les bots dont la répartition des déplacements est basée sur la vôtre. La vulnérabilité de ces robots n'est souvent pas créée (en quantité mesurable) tant que vous ne vous êtes pas écarté d'une distribution aléatoire. Généralement, votre propre bot entre dans cette catégorie.