Le pari de Blackwell


12

J'ai lu le paradoxe des paris de Blackwell sur le placard Futility . Voici le résumé: vous êtes présenté avec deux enveloppes, et . Les enveloppes contiennent une somme d'argent aléatoire, mais vous ne savez rien de la distribution de l'argent. Vous en ouvrez un, vérifiez combien il y a d'argent ( ) et devez choisir: prenez l'enveloppe ou ?E y x E x E yExEyxExEy

Futility Closet fait référence à un mathématicien du nom de Leonard Wapner: «De manière inattendue, il y a quelque chose que vous pouvez faire, à moins d'ouvrir l'autre enveloppe, pour vous donner une chance meilleure que égale de bien faire les choses.»

L'idée, qui me semble erronée, est la suivante: choisir un nombre aléatoire . Si , prenez . Si , choisissez .d < x E x d > x E ydd<xExd>xEy

Wapner: «Si d se situe entre x et y, alors votre prédiction (comme indiqué par d) est garantie d'être correcte. Supposons que cela se produit avec la probabilité p. Si d tombe moins que x et y, votre prédiction ne sera correcte que si le nombre x choisi est le plus grand des deux. Il y a 50% de chances que cela se produise. De même, si d est supérieur aux deux nombres, votre prédiction ne sera correcte que si le nombre choisi est le plus petit des deux. Cela se produit également avec une probabilité de 50%. »

Si la probabilité que soit dans est supérieure à zéro, le succès moyen de cette méthode est . Cela signifierait qu'en observant une variable aléatoire non apparentée nous donne des informations supplémentaires.[ x , y ] 1d[x,y]12+p2

Je pense que tout cela ne va pas et que le problème réside dans le choix d'un nombre aléatoire en nombres entiers. Qu'est-ce que ça veut dire? Comme, n'importe quel entier? Dans ce cas, la probabilité que se situe entre et est nulle, car et sont finis.d x y x ypdxyxy

Si nous disons qu'il y a une limite sur le montant maximal d'argent, disons , ou au moins nous choisissons d parmi , alors la recette se résume au conseil trivial de choisir si et choisir si .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

Dois-je manquer quelque chose ici?

ÉDITER

OK, maintenant je commence à voir d'où vient le paradoxe apparent. Il me semblait impossible qu'une variable aléatoire non apparentée puisse fournir des informations supplémentaires.

Cependant, notons que nous devons consciemment choisir une distribution de d . Par exemple, choisissez les limites pour une distribution uniforme, ou de la distribution Poissionian etc. Clairement, si nous jouons pour les arachides, et nous avons choisi la distribution de d pour être uniforme sur dollars, . Cette dernière probabilité dépendra avant tout de notre jugement sur ce qui peut être dans les enveloppes.[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

En d'autres termes, si la technique fonctionne, l'hypothèse selon laquelle nous ne savons pas quelle est la répartition de l'argent dans les enveloppes (comment le montant d'argent pour les enveloppes a été choisi) est violée. Cependant, si nous ne savons vraiment pas ce qu'il y a dans les enveloppes, alors dans le pire des cas, nous ne perdons rien en l'appliquant.

EDIT 2

Une autre pensée. Étant donné , choisissons, pour le dessin , une distribution non négative continue telle que . Nous sommes autorisés à le faire, ai-je raison? Nous procédons comme indiqué - si , nous gardons l'enveloppe, si , nous changeons l'enveloppe. Le raisonnement ne change pas, selon la façon dont nous choisissons la distribution, il peut s'agir de (ou je me trompe?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Cependant, étant donné la façon dont nous avons choisi la distribution, ce que nous faisons maintenant équivaut à un tirage au sort. On jette une pièce, et si c'est des têtes, on change des enveloppes, si c'est des queues, on s'en tient à l'enveloppe qu'on tient. Où ai-je tort?

EDIT 3 :

OK, je comprends maintenant. Si nous basons la fonction de probabilité de sur (par exemple, nous échantillonnons partir d'une distribution uniforme dans la plage , alors la probabilité n'est pas indépendante de .x d ( 1 , 2 x ) P ( d ( x , y ) ) P ( décision correcte | d ( x , y ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Donc, si (avec probabilité ), la supposition est toujours correcte, comme précédemment. Cependant, si est le nombre inférieur et , a plus de chances d'être inférieur à que d'être supérieur à , nous sommes donc biaisés vers une décision incorrecte. Le même raisonnement s'applique lorsque est le plus élevé des deux nombres.p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Cela signifie que nous devons choisir le processus de dessin de indépendamment de . En d'autres termes, nous devons deviner les paramètres de distribution à partir desquels et sont tirés; le pire qui se passe est que nous devinons encore au hasard, mais le mieux ce qui se passe est que notre supposition était correcte - et alors nous avons un avantage. Comment cela devrait être mieux que de deviner "x et y seront, je pense, au moins 1 $ , mais au plus 10 $ , donc si , nous le gardons, et sinon, nous l’échangeons" Je dois encore voir.x x y x > 5dxxyx>5

J'ai été induit en erreur par la formulation pop-sci du problème dans le livre de Wapner ( Attentes inattendues: les curiosités d'une boule de cristal mathématique ), qui déclare

"Par quelque moyen que ce soit, sélectionnez un entier positif aléatoire" (Wapner suggère une distribution géométrique - lancer des pièces jusqu'à ce que les premières têtes se lèvent, répétant le processus si ) "Si d > x devine plus haut et si d < x suppose plus bas. (...) Vous devinerez correctement plus de 50% du temps parce que d pointe correctement plus de 50% du temps! "d=xd>xd<xd



2
Ceci est très différent du problème des deux enveloppes dans le sens où: (1) l'argument donné pour commuter dans le problème des deux enveloppes est fallacieux, la faille dans l'argument peut être vue en ajoutant un avant bayésien tandis que (2) l'argument donné par Wapner pour le pari de Blackwell est correct.
Matthew Gunn

Si les montants d'argent dans les enveloppes sont des éléments arbitraires d'un ensemble de nombres S, une condition suffisante et nécessaire pour que la stratégie de Wapner fonctionne est que le CDF du nombre que vous choisissez d'augmenter strictement sur S.
Rétablir Monica

OK, il me manque encore quelque chose - veuillez voir mon EDIT 2, mais il me semble que nous pourrions simplement lancer une pièce et cela devrait toujours fonctionner, selon le raisonnement. Où ai-je tort?
Janvier

Réponses:


8

Il s'agit plus largement du problème des deux enveloppes . Le plus souvent, les montants sont donnés en et 2 A, mais il n'est pas obligatoire que ce soit le cas.A2A

Quelques points:

  1. Vous ne pouvez pas choisir un entier aléatoire uniformément *, mais la partie citée ne semble pas exiger qu'il soit uniforme. Choisissez une distribution - peu importe ce qu'elle est pour l'argument - tant qu'elle a une certaine probabilité de dépasser toute valeur finie.

  2. Il ne serait pas logique de choisir entier avec la règle de décision citée, car l'argent est discret, ce qui signifie qu'il y a une chance non nulle d = x et qu'il n'y a rien de répertorié pour ce cas. (Ou bien, pour modifier la règle pour spécifier quoi faire quand ils sont égaux)d d=x

  3. En laissant cela de côté, vous pouvez choisir dans une distribution continue non négative - nous n'avons donc pas à nous soucier de l'égalité.d

* (vous ne pouvez pas non plus choisir un entier non négatif uniformément aléatoire ni un entier positif uniformément aléatoire)


Md1...MEyx<M/2Exx>M/2

xM/2

Cependant, les versions de ce jeu qui m'ont été présentées pour la première fois sont que l'enveloppe est présentée par quelqu'un qui cherche (éventuellement) à minimiser vos revenus du jeu. La stratégie consistant à utiliser une distribution pour décider de passer à l'autre enveloppe fonctionnera toujours dans ce cas.


dP(d<x)=P(d>x)

P(d<x)=P(d>x)

d

en faisant de votre stratégie une fonction de x, vous ne vous donnez pas l'avantage de faire le bon choix lorsque d est entre x et y - vous définissez votre moyen de sortir du jeu. Si le lien que vous donnez prétend qu'une telle stratégie fonctionnera, ils auraient tort
Glen_b -Reinstate Monica

dxP(d(x,y))>0x(1,2x)d(x,y)
Janvier

7

L'argument de Wapner est correct!

Certains commentaires:

  • x<dd
  • d
  • Dans certaines situations (par exemple, lorsque plus vous observez, plus il est probable que vous ayez la grande enveloppe), une stratégie de coupure est même optimale.
  • Dans un cadre bayésien plus général, vous pouvez faire mieux qu'une simple stratégie de coupure pour de nombreux prieurs.

Un problème lié mais différent:

Comme plusieurs @Glen_b et @whuber l'ont mentionné, il y a un puzzle connexe connu sous le nom de problème des deux enveloppes où un argument fallacieux est donné pour toujours changer d'enveloppe et le défaut de l'argument peut être vu en adoptant une approche bayésienne et en ajoutant des croyances antérieures sur le contenu des deux enveloppes.

Dans un certain sens cependant, le puzzle décrit ici est assez différent. L'argument de Wapner est correct!


1
OK, maintenant je vois d'où vient le paradoxe. Ou, pour être précis, où les informations supplémentaires circulent dans le système. En choisissant consciemment la distribution de d , nous utilisons notre connaissance a priori de l'endroit où, plus ou moins, les montants d'argent dans les deux enveloppes devraient être. Dans le pire des cas, nos connaissances sont inutiles, mais la méthode garantit que nous ne serons pas désavantagés si nous les utilisons.
Janvier

Après réflexion, je ne comprends toujours pas - voir EDIT 2.
Janvier

1020dP(x<d)=P(x>d)

d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9

xyxdd

0

J'ai été intrigué par cela et j'ai adopté l'approche pragmatique de jouer avec lui dans Excel.

J'ai généré trois nombres aléatoires pour x, y et d dans la gamme 1-100. J'ai ensuite fait la comparaison entre d et x et entre x et y et j'ai regardé le résultat, bon ou mauvais.

Je l'ai fait 500 fois et je l'ai répété plusieurs fois et j'ai régulièrement obtenu la bonne réponse sur 330 sur 500, comme prévu.

J'ai ensuite augmenté la plage de d à 1-10000 et la réponse correcte est tombée à environ 260 pour 500 exécutions.

Alors oui, la sélection de d dépend des valeurs attendues de x et y.

Bob


0

Je pense que le paradoxe apparent avec l'expansion de Wapner de l'équation p + (1-p) / 2 est qu'il suppose que (1-p) / 2> 0. Pour de nombreuses plages de d, cette valeur est 0.

Par exemple: tout d sélectionné à partir d'une distribution symétrique centrée sur la valeur dans l'enveloppe ouverte, donne une probabilité de mal 1/2 et correct 1/2.

Toute distribution asymétriquement choisie semble biaiser le choix dans le mauvais sens la moitié du temps.

Existe-t-il donc un moyen de choisir une plage et une distribution pour d telles que cette équation soit vraie?

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.