Interprétation des valeurs de p produites par le test de Levene ou Bartlett pour l'homogénéité des variances


11

J'ai exécuté le test de Levene et Bartlett sur des groupes de données d'une de mes expériences pour valider que je ne viole pas l'hypothèse de l'ANOVA d'homogénéité des variances. J'aimerais vérifier avec vous que je ne fais pas de fausses hypothèses, si cela ne vous dérange pas: D

La valeur de p renvoyée par ces deux tests est la probabilité que mes données, si elles étaient générées à nouveau en utilisant des variances égales, seraient les mêmes. Ainsi, en utilisant ces tests, pour pouvoir dire que je ne viole pas l'hypothèse de l'ANOVA d'homogénéité des variances, je n'aurais besoin que d'une valeur p supérieure à un niveau alpha choisi (disons 0,05)?

Par exemple, avec les données que j'utilise actuellement, le test de Bartlett renvoie p = 0,57, tandis que le test de Levene (enfin ils l'appellent un test de type Brown-Forsythe Levene) donne ap = 0,95. Cela signifie, quel que soit le test que j'utilise, je peux dire que les données que je rencontre l'hypothèse. Suis-je en train de faire une erreur?

Merci.

Réponses:


8

La valeur de p de votre test de signification peut être interprétée comme la probabilité d'observer la valeur de la statistique pertinente comme étant plus ou plus extrême que la valeur que vous avez réellement observée, étant donné que l'hypothèse nulle est vraie. (notez que la valeur de p ne fait aucune référence aux valeurs de la statistique qui sont susceptibles sous l' hypothèse alternative )

p-vunelue=Pr(T>Tobs|H0)
T Tobs T H0 T

Vous ne pouvez jamais être sûr que vos hypothèses sont vraies, seulement si les données que vous avez observées sont conformes ou non à vos hypothèses . Une valeur p donne une mesure approximative de cette cohérence.

Une valeur de p ne donne pas la probabilité que les mêmes données soient observées, seulement la probabilité que la valeur de la statistique soit aussi ou plus extrême à la valeur observée, étant donné l'hypothèse nulle.


dix-30T

..continuer ... Il se peut aussi que vous ayez de très "bonnes" données (par exemple une valeur de p de 0,5). MAIS l'hypothèse alternative peut être meilleure (ou plus cohérente) avec ces données (par exemple une valeur de p de 0,99999 lorsque l'hypothèse nulle et alternative est inversée).
Probabislogic

5

Vous êtes sur "le côté droit de la valeur p". Je voudrais juste ajuster légèrement votre affirmation pour dire que, SI les groupes avaient des variances égales dans leurs populations, ce résultat de p = 0,95 indique qu'un échantillonnage aléatoire utilisant ces tailles n produirait des variances si éloignées ou plus éloignées dans 95% des cas. . En d'autres termes, à proprement parler, il est correct d'exprimer le résultat en termes de ce qu'il dit sur l'hypotherme nulle, mais pas en termes de ce qu'il dit sur l'avenir.


Je me souviens de l'interprétation de la valeur de p comme (dans ce cas): en supposant que les hypothèses nulles (c'est-à-dire l'homogénéité des variances) sont correctes, alors la probabilité d'obtenir ce résultat ou un résultat plus extrême (c'est-à-dire contrairement à la valeur nulle) ) est de 57% ou 95%. Mais quoi qu'il en soit, la conclusion est la même et correcte.
Henrik

3

Bien que les commentaires précédents soient corrects à 100%, les tracés produits pour les objets modèles en R fournissent un résumé graphique de cette question. Personnellement, je trouve toujours les tracés beaucoup plus utiles que la valeur p, car on peut transformer les données par la suite et repérer les changements immédiatement dans le tracé.


2
Bien dit, une autre chose est qu'une valeur de p ne vous dit rien sur ce qu'il faut faire si l'hypothèse nulle est "rejetée", mais un tracé des données vous donne un indice quant au problème
probabilités
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.