Enchères aléatoires optimales


7

Cette question vient de ce site Web que je lis souvent.

Deux joueurs participent à un nouveau jeu télévisé intitulé "Plus grand nombre de victoires". Les deux vont dans des cabines séparées, et chacun appuie sur un bouton, et un nombre aléatoire entre zéro et un apparaît sur un écran. (À ce stade, aucun des deux ne connaît le numéro de l'autre, mais ils savent que les numéros sont choisis dans une distribution uniforme standard.) Ils peuvent choisir de conserver ce premier numéro, ou d'appuyer à nouveau sur le bouton pour supprimer le premier numéro et en obtenir un second. nombre aléatoire, qu'ils doivent conserver. Ensuite, ils sortent de leurs cabines et voient le numéro final de chaque joueur sur le mur. Le somptueux grand prix - un boîtier rempli de lingots d'or - est décerné au joueur qui a conservé le plus grand nombre. Quel numéro est le seuil optimal pour que les joueurs rejettent leur premier numéro et en choisissent un autre? Autrement dit, dans quelle plage devraient-ils choisir de conserver le premier nombre,

C'est soit un problème d'enchères très étrange avec des joueurs symétriques (je suppose également que les joueurs sont neutres en termes de risque) ou un jeu de loterie / théorie des jeux très étrange.

Comment aborderiez-vous cette question mathématiquement et quelle réponse obtenez-vous? Il n'y a pas de prix pour moi d' obtenir la bonne réponse à l'énigme du site, je suis juste curieux. Mon intuition me dit que la coupure optimale est de 0,5, car vous avez 50 à 50 chances d'être supérieur ou inférieur au nombre de votre adversaire, qu'il répète ou non son nombre aléatoire, mais je ne suis pas sûr.


Je ne pense pas que la neutralité au risque ait quoi que ce soit à voir avec cela, les joueurs essaient simplement de maximiser leur probabilité de gagner. Les gains sont binaires, il n'y a pas de résultats moyens sûrs.
Giskard

@denesp Vous pourriez avoir une aversion au risque dans le sens où si vous deviez tirer disons 0,46, vous pourriez ne pas vouloir redessiner même si vous avez une meilleure chance d'obtenir un meilleur chiffre qu'un pire.
Cavalerie Kitsune

1
@KitsuneCavalry Je vois ce que vous dites, mais ce serait une certaine notion "comportementale" de l'aversion au risque, car elle est définie sur une étape intermédiaire plutôt que sur les résultats finaux.
Shane

@Shane Bien sûr, je t'entends. Et je ne m'inquiète pas trop de toute façon.
Cavalerie Kitsune

Réponses:


6

Je vais d'abord montrer que le point de coupure 0,5 (ou ) ne fonctionne pas comme un équilibre symétrique, puis vous pouvez décider vous-même si vous voulez penser au problème ou lire la réponse complète .12

Notons les points de par . Supposons que les deux joueurs utilisent la stratégie . Notons les nombres de joueurs et respectivement par et et leur deuxième nombre potentiel par et . Supposons que . En gardant cela, la probabilité que le joueur gagne soit Cela signifie également que estcx,cyc=12xyx1y1x2y2x1=23x

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
23la médiane de cette distribution .

Supposons maintenant . En gardant cela, la probabilité que le joueur gagne soit Mais s'il rejetait il a une probabilité de gain. donc garder (et ses environs) n'est pas optimal donc ce ne peut pas être un mouvement d'équilibre.x1=12x

P(y1<12)P(y2<12)=1212=14
x1=12
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
38>14x1=12


ALERTE SPOIL

Si le joueur a une coupure et que le joueur pioche et la garde, la probabilité que le joueur gagne soit Si le joueur où défausser la probabilité de gagner est Supposons qu'il existe une symétrie équilibre, c'est-à-dire . (Je ne pense pas qu'il existe d'autres équilibres mais je ne l'ai pas prouvé.)ycyxx1=cyx

P(y1<cy)P(y2<cy)=cycy=cy2.
xx1
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
cx=cy=c

Puisque la probabilité de gagner est continue dans la valeur de , la valeur de coupure est telle que si alors la probabilité de gagner est égale lorsque est conservé et lorsqu'il est rejeté. Cela signifie que x1cx1=cx1
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.


Quelqu'un a fait une dérivation similaire à vous, et a fait ce calcul Wolfram pour le vérifier à nouveau: tinyurl.com/j9xey5t Je vais donc aller de l'avant et dire que cela semble correct. Maintenant, si vous résolvez la forme générale de ce jeu, je vous donnerai la meilleure réponse: P Kidding ~ (Bien qu'il serait intéressant de voir comment le jeu change avec plus de chances de relancer.) Votre coupure modifiée signifie-t-elle que les deux joueurs ont 50 % de gains, ou pensez-vous toujours qu'il y a une erreur dans votre réponse?
Cavalerie Kitsune

@KitsuneCavalry Je pense que l'accepter était un peu prématuré mais heureusement le calcul est correct et mon raisonnement sur les 50% était faux. Le seuil est si élevé que le dessiner est «chanceux» et vous avez ainsi plus de 50% de chances de gagner si vous le dessinez. Avant le tirage, vous avez exactement 50%.
Giskard

Si cela compte pour quelque chose, le site qui a posé la question a donné la réponse. Vous l'avez sur l'argent. Sentez-vous comme un gagnant aujourd'hui. Vous l'avez gagné B)
Kitsune Cavalry

2

Supposons que la personne 1 choisisse un seuil de et que la personne 2 choisisse un seuil de , avec . Soit la probabilité que le nombre final de la personne 1 ne soit pas supérieur à . est égal à si et sinon. Définissez même manière. maintenant contre sur un tracé paramétrique pour . Le résultat est trois segments de ligne:c1c2c2c1p1(x)xp1(x)c1xx<c1c1x+xc1p2(x)p2(x)p1(x)0x1

  • Un de à , correspondant à ;(0,0)(c12,c1c2)0xc1
  • Un de à , correspondant à ;(c12,c1c2)(c1c2+c2c1,c22)c1xc2
  • Un de à , correspondant à .(c1c2+c2c1,c22)(1,1)c2x1

Ces trois segments de ligne divisent le carré unitaire en deux parties. L'aire de la partie sous le graphique est la probabilité que la personne 1 ait le nombre le plus élevé. Certaines géométries montrent que cette zone est . Pour qu'il y ait un équilibre stable, les deux dérivées partielles doivent être nulles, c'est dire12+12(c2c1)(c1c2+c21)

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

L'ajout des équations montre que , ce qui n'est possible que si . En substituant à nouveau dans l'une des équations, , le seul équilibre stable est donc à .(c2c1)(1+c1+c2)=0c1=c21c1c12=0c1=c2=512


C'est une excellente réponse, mais pourquoi appelez-vous l'équilibre un équilibre stable?
Giskard

1
@denesp Je suppose que c'est redondant.
f ''
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.