Comment évaluer si une pièce jetée 900 fois et qui remonte la tête 490 fois est biaisée?


9

Une pièce est lancée 900 fois et les têtes sont apparues 490 fois. Le résultat confirme-t-il l'hypothèse que la pièce n'est pas biaisée?


3
Hypothèse nulle: la pièce n'est pas biaisée. Alternative, difficile à savoir, la probabilité symétrique d'une tête est peut-être . Niveau d'importance: vous décidez. Si l'hypothèse nulle est vraie, le nombre de têtes a une distribution presque normale, écart type . Maintenant, correspond à environ unités d'écart-type de la moyenne ( ) si l'hypothèse nulle est vérifiée. D'après les tableaux de la norme normale ou non, cela a une probabilité d'environ . Donc, au niveau de signification de %, nous rejetons l'hypothèse nulle. 1/2(900)(1/2)(1/2)=154902.664500.00781

1
Vous voudrez peut-être jeter un oeil à Hypothese Testing

7
Pour référence future: il est fortement déconseillé de transposer des copies in extenso de votre question sur plusieurs sites SE . Cela se produit généralement avec les nouveaux utilisateurs qui ne connaissent pas cette politique, alors ne vous sentez pas mal. S'il vous plaît, gardez cela à l'esprit. Bienvenue sur le site.
Cardinal

Cette question, qui peut être exactement ce que le problème des devoirs d'OP Sanu énonce ou peut être la paraphrase de Sanu de la question réellement posée, dit "Le résultat confirme-t-il l'hypothèse que la pièce n'est pas biaisée?" Toutes les réponses prennent l' hypothèse nulle pour être . Ma question est: les observations soutiennent-elles jamais l'hypothèse nulle? Même si la pièce est tombée fois sur , cela ne confirme pas l'hypothèse nulle; seules des preuves très faibles soutenant le rejet du nul. La preuve est toujours en faveur du rejet du nul, jamais en faveur du nul. P(Heads)=0.5450900
Dilip Sarwate

@Dilip: Si vous relisez la réponse de Greg, vous verrez que votre commentaire ci-dessus n'est pas tout à fait vrai. Un test d'équivalence (ou, souvent, de bioéquivalence) a une alternative qui est une version légèrement "floue" de l'hypothèse souhaitée pour laquelle on veut des preuves. Je pense que vous comprendrez immédiatement pourquoi nous devons prévoir un peu plus de marge de manœuvre que nous le souhaiterions vraiment.
Cardinal

Réponses:


16

Ici, l' hypothèse nulle naturelle est que la pièce est non biaisée, c'est-à-dire que la probabilité d'une tête est égale à . L' hypothèse alternative la plus raisonnable est que , bien que l'on puisse faire un cas pour l'hypothèse alternative unilatérale . H0p1/2H1p1/2p>1/2

Nous devons choisir le niveau de signification du test. C'est à toi de voir. Deux nombres traditionnels sont % et %.51

Supposons que l'hypothèse nulle soit vérifiée. Le nombre de têtes a alors une distribution binomiale avec une moyenne et un écart type .(900)(1/2)=450(900)(1/2)(1/2)=15

La probabilité qu'en jetant une bonne pièce le nombre de têtes diffère de par ou plus (dans les deux sens) est, par symétrie, Ce n'est pas pratique à calculer à la main, mais Wolfram Alpha donne une réponse d'environ .45040

2k=490900(900k)(12)900.
0.008419

Ainsi, si la pièce n'était pas biaisée, un nombre de têtes différent de par ou plus serait peu probable. Il aurait une probabilité inférieure à %. donc au niveau de signification de %, nous rejetons l'hypothèse nulle.4504011

Nous pouvons également utiliser l' approximation normale du binôme pour estimer la probabilité que le nombre de têtes soit ou sous l'hypothèse nulle . Notre normale a une moyenne de et la variance est avec probabilité la probabilité qu'une normale standard soit . D'après les tableaux pour la normale, c'est environ . Double pour tenir compte de la queue gauche. Nous obtenons environ , assez proche de la valeur donnée par Wolfram Alpha, et inférieur à \%. Donc, si nous utilisons490410p=1/24501549040/150.00390.007811\% comme niveau de signification, encore une fois nous rejetons l'hypothèse nulle .H0

Commentaires: . Dans l'approximation normale du binôme, nous obtenons une meilleure approximation de la probabilité que le binôme soit en calculant la probabilité que la normale soit . Si vous voulez le chercher, c'est la correction de continuité . Si nous utilisons l'approximation normale avec correction de continuité, nous constatons que la probabilité de ou plus ou têtes ou moins est d'environ , assez proche de la réponse "exacte" fournie par Wolfram Alpha. Ainsi nous pouvons trouver une estimation très précise en utilisant, comme au mauvais vieux temps, des tableaux de la normale standard et en faisant l'arithmétique "à la main". 1490489.54904100.008468

2 . Supposons que nous utilisons l'hypothèse alternative un peu moins naturelle . Si , la probabilité de ou plus est d'environ . Ainsi, à nouveau au niveau de signification de %, nous rejetterions l'hypothèse nulle, en fait nous la rejetterions même si nous niveau de signification .p>1/2p=1/24900.0042110.005

La définition d'un niveau de signification est toujours nécessaire, car il est possible qu'une pièce de monnaie équitable rapporte têtes ou plus en lancers, ce qui est ridiculement peu probable. 550900


2
Cette question a été marquée comme devoirs. Dans de tels cas, il est déconseillé de donner une réponse complète et autonome qui ne laisse aucun travail à la personne qui le demande.
Macro

1
Il s'agit d'une réponse de math.SE qui a fusionné avec la question et a été rédigée par un utilisateur de très haute réputation sur math.SE. La question n'était pas étiquetée comme devoirs là-bas à l'époque.
Cardinal

Je ne comprends pas très bien la logique de "Ainsi, si la pièce était impartiale, un nombre de têtes différent de 450 par 40 ou plus serait assez improbable.". Pourquoi aurions-nous besoin de calculer la probabilité de 40 or more, mais pas 40 or lessou simplement 40?
une offre ne peut pas refuser le

et donc la réponse de @ Marco a moins de likes et beaucoup plus de commentaires provenant des confusions: p
Evan Pu

8

Si la pièce n'est pas biaisée, la probabilité de «têtes» est . Par conséquent, le nombre de têtes lancées en 900 essais, , a une distribution sous l'hypothèse nulle d'une pièce équitable. Ainsi, la valeur - la probabilité de voir un résultat aussi extrême ou plus extrême étant donné que la pièce est loin, est12XBinomial(900,12)p

P(X490)

Si vous recherchez la valeur bilatérale , ce seraitp

1P(410<X<490)

Je vous laisse expliquer pourquoi c'est le cas.

Nous savons que la fonction de masse pour , est YBinomial(n,p)

P(Y=y)=(ny)py(1p)ny

Je vous laisse le soin de calculer la valeur vous recherchez. p

Remarque: La taille de l'échantillon ici est suffisamment grande pour que vous puissiez utiliser l'approximation normale de la distribution binomiale. J'ai expliqué ci-dessus comment calculer la valeur exacte .p


La valeur de devrait-elle être calculée pour un test bilatéral ou un test unilatéral? p
Dilip Sarwate

1
J'imagine à double face, car la question ne visait qu'à déterminer si la pièce était non biaisée ou non. Autrement dit, il semble que . Mais, il n'est pas clair si ce qui est écrit ci-dessus est la question textuelle ou une paraphrase. Ha:p1/2
Macro du

1
Donc, dans ce cas, et peut-être beaucoup d'autres, la symétrie implique que la valeur bilatérale est exactement le double de la valeur unilatérale . La valeur unilatérale est inférieure à tandis que la valeur bilatérale est plus grande. Donc, le null devrait être rejeté au niveau (je sais, pas les niveaux et les plus couramment utilisés ) si nous utilisons un test unilatéral et non rejeté si nous utilisons un niveau bilatéral tester. Est-ce correct? ppp0.005p0.5%5%1%
Dilip Sarwate

1
Oui, si vous faisiez le test avec le niveau , vous rejetteriez le test unilatéral et non le test bilatéral. Que l'on fasse ou non un test unilatéral ou bilatéral doit être choisi a priori, en fonction de la question de recherche, cependant, ce problème ne devrait donc pas se poser dans la pratique. α=.005
Macro

"Que l'on fasse ou non un test unilatéral ou bilatéral a priori" est valable, mais que se passe-t-il si le choix n'a pas été fait? Faut-il dire à OP Sanu que les données expérimentales soutiennent l'hypothèse que la pièce est non biaisée au niveau de (null n'est pas rejeté par le test bilatéral) mais soutiennent également l'hypothèse que au niveau (null est rejeté par un test unilatéral)? 0.5%P(Heads)>120.5%
Dilip Sarwate

4

L' exemple de la page Wikipedia sur Bayes Factor semble tout à fait pertinent pour la question. Si nous avons deux modèles, M1 où la pièce est exactement sans biais (q = 0,5) et M2 où la probabilité d'une tête est inconnue, nous utilisons donc une distribution a priori plate sur 1. Nous calculons ensuite le facteur bayésien

K=p(x=490|M0)p(x=490|M1)

p(x=490|M1)=nchoosek(900,490)12900=7.5896×104

et

p(x=490|M2)=01nchoosek(900,490)q490(1q)410dq=1901

Donne un facteur Bayes de , qui selon l'échelle d'interprétation habituelle "mérite à peine d'être mentionné".K1.4624

Notez cependant (i) que le facteur Bayes a une pénalité d'occam intégrée qui favorise les modèles simples, et M1 est beaucoup plus simple car il n'a pas de paramètres de nuisance, alors que M2 le fait; (ii) un avant plat sur n'est pas physiquement raisonnable, en pratique une pièce biaisée va être proche de la juste à moins que la pièce ne soit manifestement asymétrique; (iii) la journée a été longue et j'aurais pu facilement commettre une erreur (n'importe laquelle) dans l'analyse des hypothèses aux calculs.q

Notez que la pièce est biaisée s'il s'agit d'un objet physique car son asymétrie signifie qu'elle ne sera pas exactement aussi susceptible de tomber dans les têtes que dans les queues.


3

Votre question pourrait être abordée de différentes manières.

Le test d'hypothèse traditionnel est conçu pour exclure les possibilités, pas nécessairement les prouver. Dans ce cas, nous pouvons utiliser comme hypothèse nulle et voir si les données (les 490 têtes sur 900) peuvent être utilisées pour rejeter cette hypothèse nulle en calculant une valeur de p. Si la valeur de p est inférieure à nous rejetons la valeur nulle, mais une valeur de p ne signifie pas que nous pouvons dire que les données prennent en charge la valeur nulle, juste qu'elle est cohérente avec l'hypothèse que la valeur nulle est vraie , mais en vérité le nul pourrait être faux, juste la vérité est une valeur de très proche de .H0:p=0.5α>αp0.5

L'approche par "équivalence" consisterait à définir sans biais non pas mais plutôt à choisir une petite région autour de 0,5 à considérer comme sans biais . Ensuite, si l'intervalle de confiance sur la vraie proportion se situe entièrement dans l'intervalle d'équivalence de "sans biais", alors les données corroboreraient l'hypothèse de "sans biais".p=0.50.5ϵ<p<0.5+ϵ

Une autre approche consisterait à utiliser une approche bayésienne où nous commençons par une distribution préalable sur la vraie proportion incluant une masse ponctuelle à 0,5 et le reste de l'étalement de probabilités entre les valeurs possibles. Combinez ensuite cela avec les données pour obtenir un postérieur. Si la probabilité postérieure de est suffisamment élevée, cela soutiendrait la prétention d'être sans biais.pp=0.5


Notez que l'approche bayésienne entraîne souvent des postérieurs continus, et donc la probabilité postérieure de est exactement 0. La question la plus intéressante est alors de savoir à quel point notre estimation postérieure diffère de 0,5. p=0.5
Michael McGowan

2
@MichaelMcGowan: si l'on commence avec une masse ponctuelle antérieure à il y aura également une masse ponctuelle postérieure. Que ce prieur ait du sens ou non dépend du problème ...p=0.5
Xi'an

2

Et une illustration R:

Sans prendre la peine d'approximer par la normale, nous pouvons regarder un binôme distribué à variable aléatoire avec n = 900 et p = 0,5 sous l'hypothèse nulle (c'est-à-dire si la pièce était sans biais alors p = probabilité de têtes (ou de queues) = 0,5).

Si nous voulons tester l'alternative que Ha: p <> 0,5 à alpha 0,05, nous pouvons regarder les queues de la distribution sous le null comme suit et voir que 490 tombe en dehors de l'intervalle {421, 479} et donc nous rejetons Ho .

n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479

1

Pour clarifier l'approche bayésienne:

Vous commencez par ne rien savoir, sauf que P(Heads)c'est dedans [0,1]. Commencez donc avec une entropie maximale avant -> uniform(0,1). Cela peut être représenté comme une distribution bêta -> beta(1,1).

Chaque fois que vous lancez la pièce, effectuez une mise à jour bayésienne de la pièce P(Heads)en multipliant chaque point de la distribution par sa probabilité (multipliez par xsi vous faites rouler les têtes, multipliez par (1-x)si vous obtenez des queues) et re-normalisez la probabilité totale à 1 C'est ce que fait la distribution bêta, donc si le premier lancer est en tête, vous en aurez beta(2,1). Dans votre cas, vous l'avez beta(490,510).

À partir de là, je calculerais l'intervalle de probabilité de 95%, et si 0,5 n'est pas dans cet intervalle, je commencerais à me méfier.

La première fois que j'ai fait cet exercice, j'ai été vraiment surpris du temps qu'il a fallu pour converger ... J'ai commencé parce que quelqu'un a dit "si vous lancez une pièce 100 fois, vous savez P(Heads)à +/- 1%" cela se révèle être totalement faux, vous avez besoin de magnitudes de plus de 100 flips.


0

Hypothèse nulle, Ho: P = 0,5 (P = Q = 0,5)

H1: P> 0,5

où P est la probabilité d'occurrence de la tête.

nous savons z = (pP) / sqrt (PQ / N)

où p = 490/900 = 0,54

Maintenant z = (0,54-0,5) / sqrt ((0,5 * 0,5) / 900)

z = 2

donc à 5% LOS (soit 1,64 <2) Ho est rejeté

d'où la pièce est biaisée .....


1
Bienvenue sur notre site! Avez-vous relu les autres réponses avant de répondre? Vous pourriez apprécier les analyses réfléchies contenues dans plusieurs d'entre elles. Ils incluent les mêmes calculs, donc je me demande quelle partie de votre réponse ou sa forme de présentation représente quelque chose de plus récent ou de meilleur que ce qui a déjà été publié.
whuber
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.