Si vous effectuez une ANOVA unidirectionnelle pour tester s'il existe une différence significative entre les groupes, vous comparez implicitement deux modèles imbriqués (il n'y a donc qu'un seul niveau d'imbrication, mais il est toujours en cours d'imbrication).
Ces deux modèles sont:
- Modèle 0: les valeurs (avec le numéro d'échantillon et le numéro de groupe) sont modélisées par la moyenne estimée, de l'échantillon entier.
yijijβ^0
yij=β^0+ϵi
Modèle 1: Les valeurs sont modélisées par les moyennes estimées des groupes.
(et si nous représentons le modèle par les variations entre les groupes,
, alors le modèle 0 est imbriqué dans le modèle 1)βj^
yi=β^0+β^j+ϵi
Un exemple de comparaison des moyennes et de l'équivalence avec des modèles imbriqués: prenons la longueur du sépale (cm) de l'ensemble de données sur l'iris (si nous utilisons les quatre variables, nous pourrions en fait faire du LDA ou de la MANOVE comme Fisher l'a fait en 1936)
Les moyennes totales et groupées observées sont:
μtotalμsetosaμversicolorμvirginica=5.83=5.01=5.94=6.59
Qui est sous forme de modèle:
model 1: model 2: yij=5.83+ϵiyij=5.01+⎡⎣⎢00.931.58⎤⎦⎥j+ϵi
Le dans le modèle 1 représente la somme totale des carrés .∑ϵ2i=102.1683
Le dans le modèle 2 représente la somme des carrés au sein du groupe .∑ϵ2i=38.9562
Et la table ANOVA sera similaire (et calculera implicitement la différence qui est la somme entre les groupes de carrés qui est le 63,212 dans la table avec 2 degrés de liberté):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
avec
F=RSSdifferenceDFdifferenceRSSnewDFnew=63.212238.956147=119.26
ensemble de données utilisé dans l'exemple:
longueur des pétales (cm) pour trois espèces différentes de fleurs d'iris
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
fonction, car la première ANOVA réelle utilise également un test F. Cela conduit à une confusion terminologique.