Une pièce est lancée 900 fois et les têtes sont apparues 490 fois. Le résultat confirme-t-il l'hypothèse que la pièce n'est pas biaisée?
Une pièce est lancée 900 fois et les têtes sont apparues 490 fois. Le résultat confirme-t-il l'hypothèse que la pièce n'est pas biaisée?
Réponses:
Ici, l' hypothèse nulle naturelle est que la pièce est non biaisée, c'est-à-dire que la probabilité d'une tête est égale à . L' hypothèse alternative la plus raisonnable est que , bien que l'on puisse faire un cas pour l'hypothèse alternative unilatérale .
Nous devons choisir le niveau de signification du test. C'est à toi de voir. Deux nombres traditionnels sont % et %.
Supposons que l'hypothèse nulle soit vérifiée. Le nombre de têtes a alors une distribution binomiale avec une moyenne et un écart type .
La probabilité qu'en jetant une bonne pièce le nombre de têtes diffère de par ou plus (dans les deux sens) est, par symétrie, Ce n'est pas pratique à calculer à la main, mais Wolfram Alpha donne une réponse d'environ .
Ainsi, si la pièce n'était pas biaisée, un nombre de têtes différent de par ou plus serait peu probable. Il aurait une probabilité inférieure à %. donc au niveau de signification de %, nous rejetons l'hypothèse nulle.
Nous pouvons également utiliser l' approximation normale du binôme pour estimer la probabilité que le nombre de têtes soit ou sous l'hypothèse nulle . Notre normale a une moyenne de et la variance est avec probabilité la probabilité qu'une normale standard soit . D'après les tableaux pour la normale, c'est environ . Double pour tenir compte de la queue gauche. Nous obtenons environ , assez proche de la valeur donnée par Wolfram Alpha, et inférieur à \%. Donc, si nous utilisons\% comme niveau de signification, encore une fois nous rejetons l'hypothèse nulle .
Commentaires: . Dans l'approximation normale du binôme, nous obtenons une meilleure approximation de la probabilité que le binôme soit en calculant la probabilité que la normale soit . Si vous voulez le chercher, c'est la correction de continuité . Si nous utilisons l'approximation normale avec correction de continuité, nous constatons que la probabilité de ou plus ou têtes ou moins est d'environ , assez proche de la réponse "exacte" fournie par Wolfram Alpha. Ainsi nous pouvons trouver une estimation très précise en utilisant, comme au mauvais vieux temps, des tableaux de la normale standard et en faisant l'arithmétique "à la main".
. Supposons que nous utilisons l'hypothèse alternative un peu moins naturelle . Si , la probabilité de ou plus est d'environ . Ainsi, à nouveau au niveau de signification de %, nous rejetterions l'hypothèse nulle, en fait nous la rejetterions même si nous niveau de signification .
La définition d'un niveau de signification est toujours nécessaire, car il est possible qu'une pièce de monnaie équitable rapporte têtes ou plus en lancers, ce qui est ridiculement peu probable.
40 or more
, mais pas 40 or less
ou simplement 40
?
Si la pièce n'est pas biaisée, la probabilité de «têtes» est . Par conséquent, le nombre de têtes lancées en 900 essais, , a une distribution sous l'hypothèse nulle d'une pièce équitable. Ainsi, la valeur - la probabilité de voir un résultat aussi extrême ou plus extrême étant donné que la pièce est loin, est
Si vous recherchez la valeur bilatérale , ce serait
Je vous laisse expliquer pourquoi c'est le cas.
Nous savons que la fonction de masse pour , est
Je vous laisse le soin de calculer la valeur vous recherchez.
Remarque: La taille de l'échantillon ici est suffisamment grande pour que vous puissiez utiliser l'approximation normale de la distribution binomiale. J'ai expliqué ci-dessus comment calculer la valeur exacte .
L' exemple de la page Wikipedia sur Bayes Factor semble tout à fait pertinent pour la question. Si nous avons deux modèles, M1 où la pièce est exactement sans biais (q = 0,5) et M2 où la probabilité d'une tête est inconnue, nous utilisons donc une distribution a priori plate sur 1. Nous calculons ensuite le facteur bayésien
où
et
Donne un facteur Bayes de , qui selon l'échelle d'interprétation habituelle "mérite à peine d'être mentionné".
Notez cependant (i) que le facteur Bayes a une pénalité d'occam intégrée qui favorise les modèles simples, et M1 est beaucoup plus simple car il n'a pas de paramètres de nuisance, alors que M2 le fait; (ii) un avant plat sur n'est pas physiquement raisonnable, en pratique une pièce biaisée va être proche de la juste à moins que la pièce ne soit manifestement asymétrique; (iii) la journée a été longue et j'aurais pu facilement commettre une erreur (n'importe laquelle) dans l'analyse des hypothèses aux calculs.
Notez que la pièce est biaisée s'il s'agit d'un objet physique car son asymétrie signifie qu'elle ne sera pas exactement aussi susceptible de tomber dans les têtes que dans les queues.
Votre question pourrait être abordée de différentes manières.
Le test d'hypothèse traditionnel est conçu pour exclure les possibilités, pas nécessairement les prouver. Dans ce cas, nous pouvons utiliser comme hypothèse nulle et voir si les données (les 490 têtes sur 900) peuvent être utilisées pour rejeter cette hypothèse nulle en calculant une valeur de p. Si la valeur de p est inférieure à nous rejetons la valeur nulle, mais une valeur de p ne signifie pas que nous pouvons dire que les données prennent en charge la valeur nulle, juste qu'elle est cohérente avec l'hypothèse que la valeur nulle est vraie , mais en vérité le nul pourrait être faux, juste la vérité est une valeur de très proche de .
L'approche par "équivalence" consisterait à définir sans biais non pas mais plutôt à choisir une petite région autour de 0,5 à considérer comme sans biais . Ensuite, si l'intervalle de confiance sur la vraie proportion se situe entièrement dans l'intervalle d'équivalence de "sans biais", alors les données corroboreraient l'hypothèse de "sans biais".
Une autre approche consisterait à utiliser une approche bayésienne où nous commençons par une distribution préalable sur la vraie proportion incluant une masse ponctuelle à 0,5 et le reste de l'étalement de probabilités entre les valeurs possibles. Combinez ensuite cela avec les données pour obtenir un postérieur. Si la probabilité postérieure de est suffisamment élevée, cela soutiendrait la prétention d'être sans biais.
Et une illustration R:
Sans prendre la peine d'approximer par la normale, nous pouvons regarder un binôme distribué à variable aléatoire avec n = 900 et p = 0,5 sous l'hypothèse nulle (c'est-à-dire si la pièce était sans biais alors p = probabilité de têtes (ou de queues) = 0,5).
Si nous voulons tester l'alternative que Ha: p <> 0,5 à alpha 0,05, nous pouvons regarder les queues de la distribution sous le null comme suit et voir que 490 tombe en dehors de l'intervalle {421, 479} et donc nous rejetons Ho .
n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479
Pour clarifier l'approche bayésienne:
Vous commencez par ne rien savoir, sauf que P(Heads)
c'est dedans [0,1]
. Commencez donc avec une entropie maximale avant -> uniform(0,1)
. Cela peut être représenté comme une distribution bêta -> beta(1,1)
.
Chaque fois que vous lancez la pièce, effectuez une mise à jour bayésienne de la pièce P(Heads)
en multipliant chaque point de la distribution par sa probabilité (multipliez par x
si vous faites rouler les têtes, multipliez par (1-x)
si vous obtenez des queues) et re-normalisez la probabilité totale à 1 C'est ce que fait la distribution bêta, donc si le premier lancer est en tête, vous en aurez beta(2,1)
. Dans votre cas, vous l'avez beta(490,510)
.
À partir de là, je calculerais l'intervalle de probabilité de 95%, et si 0,5 n'est pas dans cet intervalle, je commencerais à me méfier.
La première fois que j'ai fait cet exercice, j'ai été vraiment surpris du temps qu'il a fallu pour converger ... J'ai commencé parce que quelqu'un a dit "si vous lancez une pièce 100 fois, vous savez P(Heads)
à +/- 1%" cela se révèle être totalement faux, vous avez besoin de magnitudes de plus de 100 flips.
Hypothèse nulle, Ho: P = 0,5 (P = Q = 0,5)
H1: P> 0,5
où P est la probabilité d'occurrence de la tête.
nous savons z = (pP) / sqrt (PQ / N)
où p = 490/900 = 0,54
Maintenant z = (0,54-0,5) / sqrt ((0,5 * 0,5) / 900)
z = 2
donc à 5% LOS (soit 1,64 <2) Ho est rejeté
d'où la pièce est biaisée .....