Considérez un jeu d’information statique complet avec 2 joueurs.
Les ensembles de stratégies sont $ S_1 = \ {U, D \}, S_2 = \ {l, m, r \} $.
Les avantages ne sont pas pertinents pour cette question, car j'essaie de bien comprendre le concept de rationalisation.
Supposons que je veuille vérifier si $ m $ est une stratégie rationalisable pour le joueur 2.
Ensuite, je veux poser la question suivante:
$ \ existe \ sigma_1 = (q ^ *, 1-q ^ *) \ dans \ delta (S_1) $ tel que pour $ \ sigma ^ * _ 2 = (0,1,0), $ $ u_2 (\ sigma_1, \ sigma ^ * _ 2) \ geq u_2 (\ sigma_1, \ sigma_2) $ pour tout $ \ sigma_2 \ in \ Delta (S_2)? $
Supposons maintenant que ma matrice de gains soit telle que je puisse trouver $ (q ^ *, 1-q ^ *) $ de telle sorte
(1) $ u_2 (\ sigma_1, \ sigma ^ * _ 2) \ geq u_2 (\ sigma_1, (1,0,0)) $
(2) $ u_2 (\ sigma_1, \ sigma ^ * _ 2) \ geq u_2 (\ sigma_1, (0,0,1)) $.
Cela signifie que je pourrais trouver une plage valide de $ q ^ * $ telle que pour le joueur 2, choisir $ m $ lui procure un gain légèrement meilleur comparé aux stratégies dégénérées (c'est-à-dire pures) de $ l $ ou $ r $.
Ma question est:
Si je pouvais trouver un tel $ q ^ * $ qui satisfasse les deux (1), (2), alors je n’ai pas à rechercher d’autres profils de stratégie dans $ \ Delta (S_2) $, c’est-à-dire un combo convexe de $ ( 1,0,0) $ et $ (0,0,1) $? Mon intuition est que pour tout $ \ alpha \ in [0,1] $, je pourrais simplement avoir:
(1) '$ \ alpha u_2 (\ sigma_1, \ sigma ^ * _ 2) \ geq \ alpha u_2 (\ sigma_1, (1,0,0)) $
(2) '$ (1- \ alpha) u_2 (\ sigma_1, \ sigma ^ * _ 2) \ geq (1- \ alpha) u_2 (\ sigma_1, (0,0,1)) $.
et montrez que (1) '+ (2)' implique que la stratégie dégénérée $ m $ pour le joueur 2 est la meilleure réponse à une croyance $ \ sigma_1 \ in \ Delta (S_1) $. Par conséquent, la ligne de fond est (1), (2) est suffisant et je n'ai pas à vérifier le combo convexe des deux autres stratégies pures.