Je suis confus quant à l'hypothèse de normalité dans les mesures répétées ANOVA. Plus précisément, je me demande quel type de normalité doit être satisfait exactement. En lisant la littérature et les réponses sur CV, je suis tombé sur trois formulations distinctes de cette hypothèse.
La variable dépendante dans chaque condition (répétée) doit être distribuée normalement.
On dit souvent que rANOVA a les mêmes hypothèses que ANOVA, plus la sphéricité. C'est ce que prétendent les statistiques de Field's Discovering ainsi que l' article de Wikipedia sur le sujet et le texte de Lowry .
Les résidus (différences entre toutes les paires possibles?) Doivent être distribués normalement.
J'ai trouvé cette déclaration dans plusieurs réponses sur CV ( 1 , 2 ). Par analogie de rANOVA avec le test t apparié , cela peut également sembler intuitif.
La normalité multivariée doit être satisfaite.
Wikipédia et cette source le mentionnent. De plus, je sais que rANOVA peut être échangé avec MANOVA, ce qui pourrait mériter cette affirmation.
Ces équivalents sont-ils en quelque sorte? Je sais que la normalité multivariée signifie que toute combinaison linéaire des DV est normalement distribuée, donc 3. inclurait naturellement 2. si je comprends bien ce dernier.
Si ce ne sont pas les mêmes, quelle est la "vraie" hypothèse de la rANOVA? Pouvez-vous fournir une référence?
Il me semble que la première revendication est la plus appuyée. Ce n'est cependant pas conforme aux réponses habituellement fournies ici.
Modèles mixtes linéaires
En raison de l'allusion de @ utobi, je comprends maintenant comment rANOVA peut être reformulé en tant que modèle mixte linéaire. Plus précisément, pour modéliser l'évolution de la pression artérielle avec le temps, je modéliserais la valeur attendue comme : où sont des mesures de la pression artérielle, la pression artérielle moyenne du ème sujet, et comme ème fois que le ème sujet a été mesuré, indiquant que le changementy i j a i i t i j j i
Enfin, j'ai essayé de réfléchir à ce que cela signifie pour la normalité, mais sans grand succès. Pour paraphraser McCulloch et Searle (2001, p. 35. Eq. (2.14)):
Je comprends que cela signifie que
4. Les données de chaque individu doivent être distribuées normalement, mais ce n'est pas raisonnable de tester avec peu de points dans le temps.
Je prends la troisième expression pour signifier que
5. les moyennes des sujets individuels sont normalement distribuées. Notez que ce sont deux autres possibilités distinctes en plus des trois mentionnées ci-dessus.
McCulloch, CE et Searle, SR (2001). Modèles généralisés, linéaires et mixtes . New York: John Wiley & Sons, Inc.