J'ai toujours eu l'impression que la régression n'est qu'une forme plus générale d'ANOVA et que les résultats seraient identiques. Récemment, cependant, j'ai effectué une régression et une ANOVA sur les mêmes données et les résultats diffèrent considérablement. Autrement dit, dans le modèle de régression, les effets principaux et l'interaction sont significatifs, tandis que dans l'ANOVA, un effet principal n'est pas significatif. Je m'attends à ce que cela ait quelque chose à voir avec l'interaction, mais je ne vois pas clairement ce qui est différent dans ces deux façons de modéliser la même question. Si c'est important, un prédicteur est catégorique et l'autre est continu, comme indiqué dans la simulation ci-dessous.
Voici un exemple de l'apparence de mes données et des analyses que j'exécute, mais sans que les mêmes valeurs de p ou effets soient significatifs dans les résultats (mes résultats réels sont décrits ci-dessus):
group<-c(1,1,1,0,0,0)
moderator<-c(1,2,3,4,5,6)
score<-c(6,3,8,5,7,4)
summary(lm(score~group*moderator))
summary(aov(score~group*moderator))
group
est un vecteur numérique, est-ce exprès? Normalement, les facteurs de regroupement doivent avoir une classe factor
, de sorte que la transformation en contrastes peut être gérée automatiquement par des fonctions comme lm()
. Cela deviendra apparent une fois que vous aurez plus de deux groupes, ou utilisez un codage autre que 0/1 pour votre group
variable.