Modèles statistiques linéaires appliqués par Kutner et al. énonce ce qui suit concernant les écarts par rapport à l'hypothèse de normalité des modèles ANOVA: le kurtosis de la distribution d'erreur (soit plus ou moins atteint un pic qu'une distribution normale) est plus important que l'asymétrie de la distribution en termes d'effets sur les inférences .
Je suis un peu perplexe par cette déclaration et je n'ai pas réussi à trouver des informations connexes, que ce soit dans le livre ou en ligne. Je suis confus parce que j'ai également appris que les parcelles QQ à queue lourde sont une indication que l'hypothèse de normalité est "assez bonne" pour les modèles de régression linéaire, tandis que les parcelles QQ asymétriques sont plus préoccupantes (c'est-à-dire qu'une transformation pourrait être appropriée) .
Ai-je raison de dire que le même raisonnement vaut pour l'ANOVA et que leur choix de mots ( plus important en termes d'effets sur les inférences ) vient d'être mal choisi? C'est-à-dire qu'une distribution asymétrique a des conséquences plus graves et doit être évitée, alors qu'une petite quantité de kurtosis peut être acceptable.
EDIT: Comme adressé par rolando2, il est difficile de dire que l'un est plus important que l'autre dans tous les cas, mais je cherche simplement un aperçu général. Mon principal problème est que l'on m'a appris qu'en simple régression linéaire, les parcelles QQ avec des queues plus lourdes (= kurtosis?) Sont OK, car le test F est assez robuste contre cela. D'un autre côté, les parcelles QQ asymétriques (en forme de parabole) sont généralement plus préoccupantes. Cela semble aller directement à l'encontre des directives que mon manuel prévoit pour l'ANOVA, même si les modèles d'ANOVA peuvent être convertis en modèles de régression et devraient avoir les mêmes hypothèses.
Je suis convaincu d'oublier quelque chose ou j'ai une fausse hypothèse, mais je ne peux pas comprendre ce que cela pourrait être.