Problème de Monty Hall avec un Monty faillible


23

Monty savait parfaitement si la Porte avait une chèvre derrière (ou était vide). Ce fait permet au joueur de doubler son taux de réussite au fil du temps en passant des «suppositions» à l'autre porte. Et si les connaissances de Monty n'étaient pas parfaites? Et si parfois le prix était vraiment dans la même porte que la chèvre? Mais vous ne pouviez le voir qu'après avoir choisi et ouvert VOTRE porte? Pouvez-vous m'aider à comprendre comment calculer SI - et dans quelle mesure - le joueur peut améliorer son succès lorsque le taux de précision de Monty est inférieur à 100%? Par exemple: que se passe-t-il si Monty a tort - en moyenne-50% du temps? Le joueur peut-il TOUJOURS bénéficier d'un changement de devinette / porte? J'imagine que si Monty a moins de 33,3% de chances d'être correct que le prix n'est PAS derrière la porte, la meilleure option pour le joueur est de ne PAS changer son choix de porte. Pouvez-vous s'il vous plaît me fournir un moyen de calculer l'avantage potentiel d'un changement en insérant différentes probabilités que Monty soit correct sur le fait que le prix n'est PAS derrière la porte? Je n'ai rien au-delà des mathématiques au lycée et j'ai 69 ans, alors soyez gentil.


Merci pour les idées et les formules fournies. Il semble que si "Fallible Monty" n'est précis qu'à 66% pour prédire l'absence d'un prix / voiture, il y a un avantage ZÉRO à passer de votre choix de portes d'origine .... parce que son taux d'erreur de 33% est la valeur par défaut taux de base pour le prix étant derrière N'IMPORTE QUELLE porte. On suppose, cependant, que SI Monty obtient mieux que 66% pour prédire où il n'y a PAS DE PRIX PUIS la commutation dérive d'une plus grande utilité. J'essaierai d'appliquer ce raisonnement à un jeu où un «expert» fait une «prédiction d'experts» qu'une des trois options à peu près tout aussi probables sera la bonne. J'ai peu confiance en l'expert, et je suis certain que son "taux de réussite" sera inférieur à 33% - plutôt 15%. Ma conclusion sera que lorsque le "même option que moi, je me trompe probablement à coup sûr, et je devrais passer à l'un des deux autres! ;-)


5
Si la précision de Monty est inférieure à 100%, cela signifie-t-il qu'il ouvre parfois la porte avec le prix derrière lui? Si c'est le cas, vous devriez probablement choisir cette porte.
Fax

Réponses:


35

Commençons par le problème habituel de Monty Hall. Trois portes, dont une derrière une voiture. Les deux autres ont des chèvres derrière eux. Vous choisissez la porte numéro 1 et Monty ouvre la porte numéro 2 pour vous montrer qu'il y a une chèvre derrière celle-là. Devriez-vous changer votre supposition à la porte numéro 3? (Notez que les numéros que nous utilisons pour faire référence à chaque porte n'ont pas d'importance ici. Nous pouvons choisir n'importe quel ordre et le problème est le même, donc pour simplifier les choses, nous pouvons simplement utiliser cette numérotation.)

La réponse est bien sûr oui, comme vous le savez déjà, mais passons en revue les calculs pour voir comment ils changent plus tard. Soit l'indice de la porte avec la voiture et désigne l'événement où Monty a révélé que la porte 2 a une chèvre. Nous devons calculer . Si celle-ci est supérieure à , nous devons basculer notre supposition sur cette porte (car il ne nous reste que deux options). Cette probabilité est donnée par: (Il s'agit simplement d'appliquer la règle de Bayes avec un a priori plat sur ) est égal à 1: si la voiture est derrière la porte numéro 3 alors Monty n'avait pas d'autre choix que d'ouvrir le numéro de porte 2 comme il l'a fait. CMp(C=3|M)1/2

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
Cp(M|C=3)p(M|C=1)1/2p(M|C=2)p(C=3|Mest égal à : si la voiture est derrière la porte 1, alors Monty avait le choix d'ouvrir l'une des portes restantes, 2 ou 3. est égal à 0, parce que Monty n'ouvre jamais la porte qu'il sait a la voiture. En remplissant ces nombres, nous obtenons: Quel est le résultat que nous connaissons.1/2p(M|C=2)
p(C=3|M)=10.5+0+1=23

Considérons maintenant le cas où Monty n'a pas une parfaite connaissance de quelle porte a la voiture. Donc, quand il choisit sa porte (que nous continuerons à appeler porte numéro 2), il pourrait accidentellement choisir celle avec la voiture, car il pense qu'elle a une chèvre. Soit la porte que Monty pense avoir avec la voiture, et soit la probabilité qu'il pense que la voiture est à un certain endroit, en fonction de son emplacement réel. Nous supposerons que cela est décrit par un seul paramètre qui détermine sa précision, tel que: . Si est égal à 1, Monty a toujours raison. SiC p ( C ' | C ) q p ( C ' = x | C = x ) = q = 1 - p ( C 'x | C = x ) q q q 1 / 3p(C|C)qp(C=x|C=x)=q=1p(Cx|C=x)qqest 0, Monty a toujours tort (ce qui est toujours informatif). Si vaut , les informations de Monty ne valent pas mieux que des suppositions aléatoires.q1/3

Cela signifie que nous avons maintenant:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

Autrement dit, si la voiture était vraiment derrière la porte 3, il y avait trois possibilités qui auraient pu se jouer: (1) Monty pensait qu'elle était derrière 1, (2) Monty pensait 2 ou (3) Monty pensait 3. La dernière option se produit avec la probabilité (à quelle fréquence il a raison), les deux autres partagent la probabilité qu'il se trompe entre eux. Puis, compte tenu de chaque scénario, quelle est la probabilité qu'il ait choisi de pointer la porte numéro 2, comme il l'a fait? S'il pensait que la voiture était derrière 1, cette probabilité était de 1 sur 2, car il aurait pu choisir 2 ou 3. S'il pensait qu'elle était derrière 2, il n'aurait jamais choisi de pointer sur 2. S'il pensait qu'elle était derrière 3 , il aurait toujours choisi 2.q(1q)

De la même manière, nous pouvons calculer les probabilités restantes:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

En remplissant tout cela, nous obtenons: comme , lorsque , nous pouvons voir que nous récupérons notre réponse originale de .

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
q=111.5=23

Alors, quand devrions-nous changer? Je suppose par souci de simplicité que nous ne sommes pas autorisés à passer à la porte pointée par Monty. Et en fait, tant que Monty est au moins quelque peu susceptible d'être correct (plus que la supposition aléatoire), la porte vers laquelle il pointe sera toujours moins susceptible que les autres d'avoir la voiture, donc ce n'est pas une option viable pour nous de toute façon. Il suffit donc de considérer les probabilités des portes 1 et 3. Mais alors qu'il était impossible pour la voiture d'être derrière la porte 2, cette option a maintenant une probabilité non nulle, et il n'est donc plus nécessaire de changer lorsque , mais nous devrions plutôt changer lorsque (qui était la même chose auparavant). Cette probabilité est donnée parp(C=3|M)>0.5p(C=3|M)>p(C=1|M)p(C=1|M)=0.51.5=13, comme dans le problème original de Monty Hall. (Cela a du sens puisque Monty ne peut jamais pointer vers la porte 1, indépendamment de ce qui se trouve derrière, et qu'il ne peut donc pas fournir d'informations sur cette porte. Au contraire, lorsque sa précision tombe en dessous de 100%, l'effet est qu'une certaine probabilité "fuit" vers la porte. 2 ayant réellement la voiture.) Donc, nous devons trouver tel que : qp(C=3|M)>13

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Donc, fondamentalement, c'était une façon très longue de découvrir que, tant que la connaissance de Monty sur le véritable emplacement de la voiture est meilleure qu'une supposition aléatoire, vous devriez changer de porte (ce qui est en fait assez évident, quand vous y pensez). ). Nous pouvons également calculer combien nous sommes plus susceptibles de gagner lorsque nous passons, en fonction de la précision de Monty, car cela est donné par: (qui, lorsque , donne une réponse de 2, correspondant au fait que nous doublons nos chances de gagner en commutant les portes dans le problème d'origine de Monty Hall.)
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1

Edit: Les gens demandaient le scénario où nous sommes autorisés à passer à la porte vers laquelle Monty pointe, ce qui devient avantageux lorsque , c'est-à-dire lorsque Monty est un "menteur" (quelque peu) fiable. Dans le scénario le plus extrême, lorsque , cela signifie que la porte pense que Monty a effectivement la voiture a une chèvre. Notez, cependant, que les deux portes restantes pourraient toujours avoir une voiture ou une chèvre.q<13q=0

L'avantage de passer à la porte 2 est donné par: Ce qui n'est plus grand que 1 (et vaut donc la peine de passer à cette porte) si , c'est-à-dire si , que nous déjà établi était le point de basculement. Fait intéressant, l'avantage maximal possible pour le passage à la porte 2, lorsque , n'est que de 1,5, par rapport à un doublement de vos chances de gagner dans le problème Monty Hall d'origine (lorsque ).

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5q<13q=0q=1

La solution générale est donnée en combinant ces deux stratégies de commutation: lorsque , vous passez toujours à la porte 3; sinon, passez à la porte 2. q>13


La valeur attendue ne remonterait-elle pas réellement quand q < 1/3, parce qu'elle ne modélise pas la probabilité qu'il soit exact, elle modélise la probabilité qu'il se trompe? À l'approche de 0, cela signifierait qu'il ment toujours s'il le peut, et vos gains attendus reviendraient au 2/3
Cireo

2
@Cireo Il ne mentirait pas, il aurait tout simplement tort. Mentir impliquerait qu'il sache que sa réponse était fausse. Je soupçonne que la raison pour laquelle la valeur attendue ne remonte pas est parce que la chance qu'il pointe accidentellement vers la porte avec la voiture derrière elle (c'est-à-dire que p (M | C = 2) monte) et que vous ne pouvez pas choisir cette porte, peu importe quoi). q = 0 signifie qu'il se souvient toujours mal de l'endroit où se trouve la voiture, c'est-à-dire qu'il y a maintenant une chance relativement élevée qu'il pointe vers la porte avec la voiture derrière elle.
Buurman

3
Une solution plus générale (dont cela a évidemment besoin) inclut un Monty "hostile"; celui qui change ce qu'il pointe (ou même s'il pointe quelque chose) selon que vous avez choisi une chèvre ou une voiture.
Yakk

3
@Yakk: Il existe infiniment plus de scénarios que vous pouvez imaginer qui changent les chances de manière infinie. Tout dépend aussi si vous savez comment Monty fonctionne. Si vous savez qu'il est hostile, alors il ne peut pas réduire vos chances en dessous de 1/3, car vous décideriez simplement d'ignorer tout ce qu'il fait. Si vous ne connaissez pas son processus de décision, cela dépend totalement de ce que vous supposez et de ce qu'il fait exactement, et il existe de nombreux degrés de liberté.
Ruben van Bergen

1
@ KalevMaricq: Je n'ai pas vraiment parlé de mentir Monty. Le problème est que la voiture pourrait être derrière la porte que vous avez initialement choisie, que Monty n'est pas autorisée à choisir (sinon, je dirais que ce n'est plus le problème de Monty Hall). Il ne peut donc avoir que deux portes de chèvre parmi lesquelles il peut choisir, auquel cas il ne peut pas mentir en disant qu'il y a une chèvre derrière l'une d'elles. Je ne pense donc pas qu'il soit possible de construire un véritable "menteur Monty" dans les limites du problème. Ce que j'ai choisi à la place (pour ) est un Monty qui confond toujours une porte de chèvre avec la porte de voiture, mais nous ne savons pas quelle porte de chèvre. q=0
Ruben van Bergen

7

Cela devrait être une variation assez simple du problème (bien que je note votre expérience limitée en mathématiques, donc je suppose que c'est relatif). Je suggérerais que vous essayiez d'abord de déterminer la solution conditionnelle à savoir si Monte est infaillible ou entièrement faillible. Le premier cas est juste le problème ordinaire de Monte Hall, donc aucun travail n'y est requis. Dans le second cas, vous considéreriez la porte qu'il choisit comme aléatoire sur toutes les portes, y compris la porte avec le prix (c'est-à-dire qu'il pourrait toujours choisir une porte sans prix, mais c'est maintenant aléatoire). Si vous pouvez calculer la probabilité de gagner dans chacun de ces cas, vous pouvez utiliser la loi de la probabilité totale pour déterminer les probabilités de gain pertinentes dans le cas où Monte a un certain niveau de faillibilité spécifié (spécifié par une probabilité que nous sommes infaillibles par rapport à entièrement faillible).


2
J'apprécie la réponse, mais je cherchais quelque chose de plus précis. Je précise que Monty a choisi une porte. Je précise que la probabilité que le prix soit derrière cette porte pourrait être de zéro à 100%. J'espérais une formule qui me permettrait simplement d'entrer la probabilité que Monty ait raison / tort, puis de travailler sur le reste de la formule fournirait une estimation numérique qui indique la probabilité que le changement se traduise par une victoire. Ce degré d'assistance est-il une demande irréaliste?
Pseudoego

4

Sur la base des commentaires sur la réponse de Ben, je vais proposer deux interprétations différentes de cette variante de Monty Hall, différentes de celles de Ruben van Bergen.

Le premier que je vais appeler Liar Monty et le second Unreliable Monty. Dans les deux versions, le problème se déroule comme suit:

(0) Il y a trois portes, derrière l'une, une voiture et derrière les deux autres, des chèvres, réparties au hasard.

(1) Le candidat choisit une porte au hasard.

(2) Monty choisit une porte différente de celle du concurrent et prétend qu'une chèvre est derrière.

(3) Le candidat est proposé de passer à la troisième porte non choisie, et le problème est "Quand le candidat doit-il changer afin de maximiser la probabilité de trouver une voiture derrière la porte?"

Dans Liar Monty, à l'étape (2), si le concurrent a choisi une porte contenant une chèvre, alors Monty choisit une porte contenant la voiture avec une probabilité prédéfinie (c'est-à-dire qu'il y a une chance entre 0 et 100% qu'il mentira qu'un chèvre est derrière une porte). Notez que dans cette variante, Monty ne choisit jamais une porte contenant la voiture (c'est-à-dire ne peut pas mentir) si le concurrent a choisi la voiture à l'étape (1).

Dans Unreliable Monty, il existe une probabilité prédéfinie que la porte choisie par Monty à l'étape (2) contienne une voiture. Je retiens de votre commentaire sur la réponse de Ben que c'est le scénario qui vous intéresse, et mes deux versions diffèrent de Ruben van Bergen. Notez que Unreliable Monty n'est pas la même chose que Liar Monty; nous différencierons rigoureusement ces deux cas ultérieurement. Mais considérez ceci, dans ce scénario, la porte de Monty ne peut jamais contenir la voiture plus de du temps, car le concurrent a une probabilité de choisir la voiture de l'époque .2313

Pour répondre au problème, nous allons devoir utiliser certaines équations. Je vais essayer de formuler ma réponse pour qu'elle soit accessible. Les deux choses qui, je l'espère, ne prêtent pas à confusion sont la manipulation algébrique des symboles et la probabilité conditionnelle. Pour les premiers, nous utiliserons des symboles pour désigner les éléments suivants:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Nous utilisons pour désigner "la probabilité de ", de sorte que, mis ensemble, quelque chose comme signifie la probabilité que la voiture ne soit pas derrière la porte choisie par Monty. (C'est-à-dire partout où vous voyez une expression impliquant les symboles, remplacez les symboles par les équivalents "anglais".)Pr()Pr(M¯)

Nous aurons également besoin d'une compréhension rudimentaire de la probabilité conditionnelle, qui est à peu près la probabilité que quelque chose se produise si vous avez connaissance d'un autre événement connexe. Cette probabilité sera représentée ici par des expressions telles que . La barre verticalepeut être considérée comme l'expression "si vous le savez", de sorte que peut être lu comme "la probabilité que la porte vers laquelle le concurrent peut passer a la voiture, si vous savez que le la voiture n'est pas derrière la porte de Monty. Dans le problème d'origine de Monty Hall, , qui est plus grand que , ce qui correspond au cas où Monty ne vous a donné aucune information.Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13

Je vais maintenant démontrer qu'Unreliable Monty est équivalent à Liar Monty. Dans Liar Monty, on nous donne la quantité , la probabilité que Monty mentira à sa porte, sachant que le concurrent n'a pas choisi la voiture. Dans Unreliable Monty, on nous donne la quantité , la probabilité que Monty se trouve à sa porte. Utilisation de la définition de la probabilité conditionnelle , et en réarrangeant, on obtient:Pr(M|C¯)Pr(M) Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
depuis , la probabilité que la voiture soit pas derrière la porte choisie par le concurrent est et , la probabilité que la voiture ne soit pas derrière la porte choisie par le concurrent, si nous savons qu'elle est derrière la porte de Monty , est une.Pr(C¯)23Pr(C¯|M)

Ainsi, nous avons montré le lien entre Unreliable Monty (représenté par LHS de l'équation ci-dessus) et Liar Monty (représenté par RHS). Dans le cas extrême de Monty non fiable, où Monty choisit une porte qui cache la voiture de l'époque, cela équivaut à Monty couché tout le temps à Liar Monty, si le concurrent a choisi une chèvre à l'origine .23

Cela dit, je vais maintenant fournir suffisamment d'informations pour répondre à la version Liar du problème de Monty Hall. Nous voulons calculer . En utilisant la loi de probabilité totale :Pr(S)

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
puisque et (convaincez-vous de cela!).Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1

Continuant:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

Donc, vous voyez, quand Monty ment toujours (aka ) alors vous avez zéro chance de gagner si vous changez toujours, et s'il ne ment jamais, alors la probabilité que la voiture soit derrière la porte vers laquelle vous pouvez basculer, , est .Pr(M|C¯))=1Pr(S)23

À partir de cela, vous pouvez déterminer les stratégies optimales pour Liar et Unreliable Monty.

Addendum 1

En réponse au commentaire (je souligne):

"J'ai ajouté plus de détails dans mon commentaire à @alex - Monty n'est jamais hostile ni sournois, juste FALLIBLE, car parfois il peut se tromper pour quelque raison que ce soit et n'ouvre jamais la porte. La recherche montre que Monty a tort environ 33,3% des temps, et la voiture se révèle être là. C'est une probabilité postérieure d'être correcte 66,6% du temps, n'est-ce pas? Monty ne choisit jamais VOTRE porte, et vous ne choisirez jamais la sienne . Ces hypothèses changent-elles quelque chose? "

Voici ce que je comprends, le problème de Monty Hall peu fiable introduit au début de ma réponse.

Par conséquent, si la porte de Monty contient la voiture de l'époque, nous avons la probabilité de gagner lorsque vous passez à la dernière porte non sélectionnée comme:13

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Ainsi, il n'y a pas de différence entre changer, rester avec la porte d'origine ou, si autorisé, passer à la porte choisie par Monty (conformément à votre intuition).


Alex et @Ruben van Bergen et al Merci pour les détails utiles. Supposons que Monty n'est jamais hostile, juste faillible et vous dit "Je suis presque sûr que la voiture n'est PAS derrière cette porte." mais n'ouvre pas la porte. Supposons que la recherche montre qu'il se trompe seulement environ 33,3% du temps, donc corrigez 66,6% (une probabilité postérieure?). Il y a toujours un avantage à changer, mais une fois que sa précision n'atteint que 33,3%, cela n'aurait aucun sens de passer à sa porte ou à l'autre. Littéralement un cas de "votre supposition est aussi bonne que la mienne." Est-ce que tout cela modifie vos analyses ou formules?
Pseudoego

Non, cela ne change pas mon analyse. J'ai ajouté quelque chose qui, je l'espère, clarifie la question dans votre commentaire. Btw, je ne lirais pas trop dans les mots "hostile", "faillible", "mensonges monty". Celles-ci ne signifient vraiment rien sauf si elles sont définies avec précision comme la probabilité (conditionnelle) que Monty se trompe au sujet d'une porte contenant une chèvre.
Alex

Assez ennuyé que ma PROPRE réponse à MA PROPRE question soit supprimée avec la seule explication donnée est que ce site n'est pas pour "discussion" - quand j'explique principalement pourquoi je pense que les réponses données jusqu'à présent sont correctes, et expliquant comment elles sois utile. Il y a eu beaucoup plus de discussions dans la plupart des autres réponses données. Cela me semble myope - au mieux - et idiot - au pire - de supprimer la réponse de quelqu'un à sa propre question: comment pouvez-vous expliquer pourquoi vous notez une réponse comme la MEILLEURE sans en discuter? Merci à tous ceux qui ont répondu malgré tout.
Pseudoego

@Pseudoego, votre dernier commentaire est préférable de publier un commentaire sur votre question d'origine. Je n'ai pas vu votre réponse, mais il semble que vous souhaitiez discuter des réponses existantes, auquel cas vous pouvez modifier votre question d'origine.
Alex

0

Pour une raison quelconque, un modérateur a décidé de supprimer ma propre réponse à ma propre question, au motif qu'elle contenait une "discussion". Je ne vois pas vraiment COMMENT je peux expliquer quelle est la meilleure réponse sans discuter de ce qui la fait fonctionner pour moi, et comment elle peut être appliquée dans la pratique.

J'apprécie les idées et les formules qui ont été fournies dans les réponses précédentes. Il semble que SI "Fallible Monty" n'est précis qu'à 66% pour prédire l'absence d'un prix / d'une voiture ALORS il y a un avantage ZÉRO à passer de votre choix de portes d'origine .... parce que son taux d'erreur de 33% est la valeur par défaut taux de base pour le prix étant derrière N'IMPORTE QUELLE porte. On suppose, cependant, que SI Monty obtient mieux que 66% pour prédire où il n'y a PAS DE PRIX PUIS la commutation dérive d'une plus grande utilité.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.