Imaginez-vous être dans une situation où vous effectuez de nombreux tests similaires, dans un ensemble de circonstances où une partie des valeurs nulles sont vraies.
t .
( 1 - β)β
n d'entre eux, disons) "au hasard", les effectuez et rejetez ou échouez à rejeter leur hypothèse. On peut supposer que le nombre total d'expériences dans l'urne (M, disons) est suffisamment grand pour que cela ne fasse aucune différence que ce soit un échantillonnage sans remplacement (c'est-à-dire que nous serions heureux d'approcher cela comme un binôme si besoin est), et n et M sont assez grands pour que nous puissions discuter de ce qui se passe en moyenne comme si c'était ce que nous vivions.
Quelle proportion de vos refus sera "correcte"?
Nombre total de refus prévu: n t α + n ( 1 - t ) ( 1 - β)
Nombre total prévu de refus corrects: n ( 1 - t ) ( 1 - β)
Proportion globale de fois où un rejet était en fait la bonne décision: ( 1 - t ) ( 1 -β)t α + ( 1 - t ) ( 1 - β)
Proportion globale de fois où un rejet était une erreur: t αt α + ( 1 - t ) ( 1 - β)
Pour que la proportion de refus corrects soit supérieure à un petit nombre, vous devez éviter la situation où ( 1 - t ) ( 1 - β) ≪ t α
Étant donné que dans notre configuration, une fraction substantielle des valeurs nulles sont vraies, si 1 - β n'est pas sensiblement plus grand que α (c'est-à-dire si vous n'avez pas une puissance assez élevée), beaucoup de nos rejets sont des erreurs!
Ainsi, lorsque la taille de votre échantillon est petite (et donc la puissance est faible), si une fraction raisonnable de nos valeurs nulles était vraie, nous commettions souvent une erreur lorsque nous rejetions.
La situation n'est pas beaucoup meilleure si presque toutes nos nullités sont strictement fausses - alors que la plupart de nos rejets seront corrects (trivialement, car de minuscules effets sont toujours strictement faux), si la puissance n'est pas élevée, une fraction substantielle de ceux-ci les rejets seront "dans la mauvaise direction" - nous conclurons que le null est faux assez souvent parce que par hasard l'échantillon s'est avéré être du mauvais côté (cela peut être un argument pour utiliser des tests unilatéraux - quand des tests unilatéraux font sens - pour au moins éviter les rejets qui n'ont aucun sens si de grands échantillons sont difficiles à obtenir).
Nous pouvons voir que de petites tailles d'échantillon peuvent certainement être un problème.
[Cette proportion de refus incorrects est appelée le taux de fausses découvertes ]
Si vous avez une idée de la taille probable de l'effet, vous êtes mieux placé pour juger de la taille adéquate d'un échantillon. Avec de grands effets anticipés, un rejet avec un échantillon de petite taille ne serait pas nécessairement une préoccupation majeure.