Voici une approche «maximisation de l'utilité attendue / théorie des jeux» (avec un tiret de probabilité théorique). Dans un tel cadre, les réponses apparaissent claires.
LOCAUX
On nous dit en toute honnêteté que, par X un montant monétaire strictement positif, les deux billets suivants ont été placés dans une boîte: {A=x,B=2x} avec numéro d'identification attribué 1 et {A=2x,B=x} avec numéro d'identification attribué 0. Puis un tirage au sort d'un Bernoulli (p=0.5) variable aléatoire a été exécutée, et en fonction du résultat et de l'événement qui s'est produit, les montants x et 2x ont été placés dans des enveloppes A et B. On ne nous dit pas quelle est la valeur dex est, ou quel montant est allé à quelle enveloppe.
Premier CAS: Choisissez une enveloppe avec la possibilité de changer sans l'ouvrir
Le premier problème est de savoir comment choisir une enveloppe ? Cela a à voir avec les préférences. Supposons donc que nous sommes des maximiseurs d'utilité attendus, avec une fonction d'utilitéu().
Nous pouvons modéliser ici la structure probabiliste en considérant deux variables aléatoires dichotomiques, A et Breprésentant les enveloppes et leur montant. Le soutien de chacun est{x,2x}. Mais ils ne sont pas indépendants. Nous devons donc commencer par la distribution conjointe. Sous forme de tableau, la distribution conjointe et les distributions marginales correspondantes sont
A/B→x2xMarg Bx00.50.52x0.500.5Marg A0.50.51.00
Cela nous dit que A et B ont des distributions marginales identiques.
Mais cela signifie que la façon dont nous choisissons les enveloppes n'a pas d'importance, car nous obtiendrons toujours la même utilité attendue ,
0.5⋅u(x)+0.5⋅u(2x)
Ce à quoi nous sommes confrontés ici, c'est un pari composé (comment choisir une enveloppe) sur deux paris identiques (chaque enveloppe). Nous pouvons choisirA avec probabilité 1, 0, ou quelque chose entre les deux (et en complément pour B). Ça n'a pas d'importance. Nous obtiendrons toujours le même utilitaire attendu. Notez que notre attitude envers le risque ne joue aucun rôle ici.
Nous choisissons donc une enveloppe, disons Aet nous l'examinons. Quelle est maintenant notre utilité attendue? Exactement les mêmes qu'avant de choisir . Choisir une enveloppe de quelque manière que ce soit n'affecte pas les probabilités de ce qu'il y a à l'intérieur.
Nous sommes autorisés à changer. Disons que oui, et maintenant nous tenons l'enveloppeB. Quelle est maintenant l'utilité attendue? Exactement comme avant .
Ce sont les deux états possibles du monde pour nous: choisir A ou choisissez B. Quel que soit le choix, les deux états du monde impliquent la même valeur pour notre force motrice choisie / supposée (c.-à-d. Maximiser l'utilité attendue).
Donc ici, nous sommes indifférents au changement. , et en fait, nous pourrions également randomiser.
2ème CAS: OUVRIR L'ENVELOPPE avec la possibilité de basculer après
Supposons maintenant que nous avons choisi A, l'ouvrit et trouva l'intérieur du montant y∈{x,2x}. Est-ce que cela change les choses?
Voyons voir. Je me demande ce qui est
P(A=x∣A∈{x,2x})=?
Bien, {x,2x} est l'espace d'échantillon sur lequel la variable aléatoire Aest défini. Le conditionnement sur tout l'espace de l'échantillon, c'est-à-dire sur l'algèbre sigma triviale, n'affecte ni les probabilités, ni les valeurs attendues. C'est comme si on se demandait "quelle est la valeur deA si nous savons que toutes les valeurs possibles peuvent avoir été réalisées? "Aucune connaissance efficace n'a été acquise, nous sommes donc toujours à la structure probabiliste d'origine.
Mais je me demande aussi ce qui est
P(B=x∣A∈{x,2x})=?
L'énoncé de conditionnement, correctement considéré comme une algèbre sigma générée par l'événement {A∈{x,2x}}, est l'ensemble de l'espace d'échantillonnage du produit sur lequel le vecteur aléatoire (A,B)a été défini. D'après le tableau de la distribution conjointe ci-dessus, nous pouvons voir que l'allocation de probabilité du joint est équivalente à l'allocation de probabilité des marginaux (la qualification "presque sûrement" due à la présence de deux événements de mesure zéro). Ici aussi, nous conditionnons essentiellement les probabilités deBsur tout son espace d'échantillonnage. Il s'ensuit que notre action d'ouverture de l'enveloppe n'a pas affecté la structure probabiliste deB aussi.
Entrez dans la théorie des jeux, parallèlement à la prise de décision. Nous avons ouvert l'enveloppe et nous devons décider si nous allons changer ou non. Si nous ne changeons pas, nous obtenons une utilitéu(y). Si nous changeons, alors nous sommes dans les deux états possibles du monde suivants
y=x,u(A)=u(x)⟹u(B)=u(2x)
y=2x,u(A)=u(2x)⟹u(B)=u(x)
Nous ne savons pas quel état détient réellement, mais d'après la discussion ci-dessus, nous savons que chacun a une probabilité p=0.5 d'exister.
Nous pouvons modéliser cela comme un jeu où notre adversaire est la "nature" et où nous savons que la nature joue avec certitude une stratégie aléatoire : avecp=0.5 y=x et avec p=0.5, y=2x. Mais nous avons aussi maintenant que si nous ne changeons pas, notre gain est certain. Voici donc notre jeu sous forme normale, avec nos gains:
We/nature→SwitchDon't Switchy=xu(2x)u(y)y=2xu(x)u(y)
Nous devons résister à la tentation de remplacer u(x) et u(2x) pour u(y). u(y)est un gain connu et certain. Les gains de la stratégie "Switch" ne sont pas réellement connus (car nous ne connaissons pas la valeur dex). Nous devons donc inverser la substitution . Siy=x puis u ( 2 x ) = u ( 2 y), et si y= 2 x puis u ( x ) = u ( y/ 2). Voici donc à nouveau notre jeu:
nous/nature →CommutateurNe changez pasy= xu ( 2 y)u ( y)y= 2 xu ( y/ 2)u ( y)
Maintenant, tous les gains de la matrice sont connus. Existe-t-il une stratégie purement dominante?
Le gain attendu de la stratégie "Switch" est
E(VS) = 0,5 ⋅ u ( 2 y) + 0,5 ⋅ u ( y/ 2)
Le gain attendu de la stratégie "Don't Switch" est
E(VD S) = u ( y)
Nous devrions changer si
E(VS) > E(VD S)⟹0,5 ⋅ u ( 2 y) + 0,5 ⋅ u ( y/ 2)>u(y)
Et maintenant , l'attitude envers le risque devient critique. Il n'est pas difficile de déduire que sous une prise de risque et un comportement neutre au risque, nous devrions changer.
En ce qui concerne les comportements à risque , je trouve un résultat élégant:
Pour les fonctions utilitaires «moins concaves» (strictement ci-dessus) que les fonctions logarithmiques (par exemple, racine carrée), nous devons alors changer.
Pour l'utilitaire logarithmique u ( y) = lny, nous sommes indifférents entre la commutation ou non.
Pour les fonctions utilitaires logarithmiques "plus concaves" que (strictement ci-dessous), nous ne devrions pas commuter.
Je termine avec le schéma du cas logarithmique
Présumer y= 4. alorsy/ 2=2,2y= 8. La ligneΓ - Δ - Eest la ligne sur laquelle se trouvera l'utilitaire attendu de "Switch". Puisque la nature joue un50 - 50 stratégie, il sera en fait au point Δ, qui est le point médian de Γ - Δ - E. À ce stade, avec l'utilitaire logarithmique, nous obtenons exactement le même utilitaire de "Don't Switch", c'est-à-direln( 4 ) pour cet exemple numérique.