Contrôle de santé mentale: à quel point une valeur de p peut-elle descendre?

J'utilise un test de ranksum pour comparer la médiane de deux échantillons ( ) et ont constaté qu'ils sont très différents avec: . Dois-je me méfier d'une si petite valeur ou dois-je l'attribuer à la puissance statistique élevée associée à la présence d'un très grand échantillon? Existe-t-il une valeur étrangement basse ? $n=120000$ p = 1.12E-207 $p$ $p$

— N26
source

Il s'agit presque d'un doublon de stats.stackexchange.com/questions/78839 .

— amibe dit Réintégrer Monica

Réponses:

Les valeurs de p sur les ordinateurs standard (utilisant des flotteurs à double précision IEEE) peuvent descendre jusqu'à environ . Ces calculs peuvent être légitimement corrects lorsque les tailles d'effet sont grandes et / ou que les erreurs standard sont faibles. Votre valeur, si elle est calculée avec une distribution T ou normale, correspond à une taille d'effet d'environ 31 erreurs standard. N'oubliez pas que les erreurs standard sont généralement mises à l'échelle avec la racine carrée réciproque de , ce qui reflète une différence de moins de 0,09 écart type (en supposant que tous les échantillons sont indépendants). Dans la plupart des applications, une telle différence n'aurait rien de suspect ou d'inhabituel. $10^{-303}$ $n$

L'interprétation de ces valeurs p est une autre affaire. Voir un nombre aussi petit que ou même comme probabilité dépasse les limites de la raison, étant donné toutes les manières dont la réalité est susceptible de s'écarter du modèle de probabilité qui sous-tend ce p- calcul de la valeur. Un bon choix consiste à signaler la valeur de p comme étant inférieure au plus petit seuil que le modèle peut raisonnablement prendre en charge: souvent entre et . $10^{-207}$ $10^{-10}$ $0.01$ $0.0001$

— whuber
source

Quand j'ai signalé ''

'' dans un document de conférence, un critique m'a dit que je devrais le changer en ''

'' afin de suivre les directives de l'APA.

p < 10^{- 26}

$p<10^{-26}$

p < 0.001

$p<0.001$

— Thomas Levine

@whuber - Magnifiquement déclaré.

— rolando2

(+1) À un moment donné, il est plus probable que le gouvernement retourne à distance des bits dans votre RAM avec la technologie super espion ...

— JMS

(+1) Vous pouvez en fait descendre juste en dessous de

en virgule flottante double précision IEEE. Mais, vos routines numériques pour le calcul des valeurs de

sont presque garanties de s'effondrer avant cela. À moins que vous ne sachiez avec certitude que vos hypothèses de modélisation sont parfaitement correctes (et quand le sont-elles?), Une valeur

ne devient finalement qu'une mesure de la taille de l'échantillon une fois que l'échantillon est suffisamment grand.

5 \times 10^{- 324}

$5 \times 10^{-324}$

p

$p$

p

$p$

— cardinal

@Cardinal nous sommes tous les deux tort sur les limites: en dehors des valeurs dénormalisées, l' IEEE le plus petit à double est d' environ

, correspondant aux bits dix pour un exposant de base 2.

10^{- 308}

$10^{-308}$

— whuber

Il n'y a rien de suspect - des valeurs de p extrêmement faibles comme la vôtre sont assez courantes lorsque la taille des échantillons est grande (comme la vôtre pour comparer les médianes). Comme indiqué plus haut, ces valeurs de p sont normalement signalées comme étant inférieures à un certain seuil (par exemple <0,001).

Une chose à laquelle il faut faire attention est que les valeurs de p vous indiquent uniquement si la différence de médiane est statistiquement significative. Vous devrez décider si la différence est suffisamment importante: par exemple, pour de grands ensembles d'échantillons, de très petites différences de moyennes / médianes peuvent être statistiquement significatives, mais cela peut ne pas signifier beaucoup.

— xuexue
source

Une valeur de p peut atteindre une valeur de 0.

$\theta$ $\mathcal{H}_0: \theta = 1$ $X=1.1$

— AdamO
source