Étant donné un jeu déterministe à somme partielle et à informations partielles avec seulement un nombre fini d'états,
dont les résultats possibles sont [perdre, dessiner, gagner] avec des valeurs [-1,0, + 1] respectivement,
quelle est la complexité de l'approximation de la valeur de tels un jeu additivement dans ?
En particulier, je ne peux trouver aucun algorithme pour le faire.
Le reste de cet article est entièrement consacré à donner une description plus approfondie
du problème, donc si vous pouvez déjà comprendre ce que signifie la question en haut
de cet article, il n'y a aucune raison pour que vous lisiez le reste de cet article.
Compte tenu d' une machine arbitre avec les états , avec un état initial désigné s 0 , un état s a dont la paire de scores est [ - 1 , + 1 ] , un état s b dont la paire de scores est [ + 1 , - 1 ] , et des états de la forme
où:
- est une fonction de { 1 , 2 , 3 , . . . , Num_of_choices } → { 1 , 2 , 3 , . . . , S }
Lorsque la machine est dans cet état:
- envoie à Player_1 et envoie p2_info à Player_2,
- s'arrête avec la paire de scores de cet état comme sortie
Quelle est la complexité du problème suivant?
Étant donné une telle machine d'arbitre et un entier positif N, émettez un nombre rationnel
qui est (additivement) à 1 / N de la valeur du jeu naturel pour le joueur 1.
Comme mentionné précédemment dans cette question, je ne peux trouver
aucun algorithme pour le faire.