Intuition derrière l'hypothèse de sphéricité
L'une des hypothèses des mesures communes non répétées, l'ANOVA est une variance égale dans tous les groupes.
(Nous pouvons le comprendre car une variance égale, également connue sous le nom d' homoscédasticité , est nécessaire pour que l'estimateur OLS en régression linéaire soit BLEU et pour que les tests t correspondants soient valides, voir le théorème de Gauss-Markov . Et l'ANOVA peut être implémentée comme linéaire régression.)
Essayons donc de réduire le cas RM-ANOVA au cas non RM. Par souci de simplicité, je traiterai de RM-ANOVA à un facteur (sans aucun effet inter-sujet) qui a sujets enregistrés dans conditions RM.knk
Chaque sujet peut avoir son propre décalage ou interception spécifique au sujet. Si nous soustrayons les valeurs d'un groupe des valeurs de tous les autres groupes, nous annulerons ces interceptions et arriverons à la situation où nous pourrons utiliser des non-RM-ANOVA pour tester si ces différences de groupe sont toutes nulles. Pour que ce test soit valide, nous avons besoin d'une hypothèse de variances égales de ces différences .k - 1k−1k−1
Maintenant, nous pouvons soustraire le groupe # 2 de tous les autres groupes, en obtenant à nouveau des différences qui devraient également avoir des variances égales. Pour chaque groupe sur , les variances des différences correspondantes doivent être égales. Il s'ensuit rapidement que toutes les différences possibles doivent être égales.k k - 1 k ( k - 1 ) / 2k−1kk−1k(k−1)/2
C'est précisément l'hypothèse de sphéricité.
Pourquoi les variances de groupe ne devraient-elles pas être égales elles-mêmes?
Lorsque nous pensons à RM-ANOVA, nous pensons généralement à un simple modèle additif de style modèle mixte de la forme où sont des effets de sujet, sont des effets de condition, et .α i β j ϵ ∼ N ( 0 , σ 2 )
yij=μ+αi+βj+ϵij,
αiβjϵ∼N(0,σ2)
Pour ce modèle, les différences de groupe suivront , c'est-à-dire auront toutes la même variance , donc la sphéricité tient. Mais chaque groupe suivra un mélange de Gaussiens avec des moyennes à et des variances , qui est une distribution compliquée avec une variance qui est constante entre les groupes.N(βj1−βj2,2σ2)2σ2nαiσ2V(α⃗ ,σ2)
Donc, dans ce modèle, en effet, les variances de groupe sont également les mêmes. Les covariances de groupe sont également les mêmes, ce qui signifie que ce modèle implique une symétrie composée . Il s'agit d'une condition plus stricte par rapport à la sphéricité. Comme le montre mon argument intuitif ci-dessus, RM-ANOVA peut fonctionner correctement dans la situation plus générale, lorsque le modèle additif écrit ci - dessus ne tient pas .
Énoncé mathématique précis
Je vais ajouter ici quelque chose de Huynh & Feldt, 1970, Conditions dans lesquelles les rapports carrés moyens dans les conceptions de mesures répétées ont des distributions exactesF .
Que se passe-t-il lorsque la sphéricité se brise?
Lorsque la sphéricité ne tient pas, nous pouvons probablement nous attendre à ce que RM-ANOVA (i) ait une taille gonflée (plus d'erreurs de type I), (ii) ait une puissance diminuée (plus d'erreurs de type II). On peut l'explorer par des simulations, mais je ne vais pas le faire ici.