Ma question principale est de savoir comment interpréter la sortie (coefficients, F, P) lors d’une analyse de variance de type I (séquentielle)?
Mon problème de recherche spécifique est un peu plus complexe, je vais donc décomposer mon exemple en plusieurs parties. Premièrement, si je suis intéressé par l’effet de la densité de l’araignée (X1) sur la croissance des plantes (Y1) et que j’ai planté des plants dans des enclos et manipulé la densité de l’araignée, je peux analyser les données avec une simple analyse de variance ou une régression linéaire. Dans ce cas, peu importe si j'utilise la somme des carrés (SS) de types I, II ou III pour mon ANOVA. Dans mon cas, j'ai 4 répétitions de 5 niveaux de densité, je peux donc utiliser la densité comme facteur ou comme variable continue. Dans ce cas, je préfère l’interpréter comme une variable continue (prédicteur) indépendante. Dans RI peut exécuter ce qui suit:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Exécuter la fonction anova aura du sens pour une comparaison ultérieure, espérons-le, alors ignorez-le ici. La sortie est:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Maintenant, supposons que je soupçonne que le niveau de départ d’azote inorganique dans le sol, que je ne pouvais pas contrôler, aurait également affecté de manière significative la croissance de la plante. Je ne suis pas particulièrement intéressé par cet effet, mais j'aimerais potentiellement rendre compte de la variation qu'il provoque. En réalité, mon intérêt principal porte sur les effets de la densité des araignées (hypothèse: une augmentation de la densité des araignées entraîne une augmentation de la croissance des plantes - vraisemblablement par la réduction des insectes herbivores mais je ne teste que l'effet et pas le mécanisme). Je pourrais ajouter l'effet de l'azote inorganique à mon analyse.
Pour les besoins de ma question, supposons que je teste la densité d'interaction * inorganique et qu'elle est non significative. Je la supprime donc de l'analyse et exécute les principaux effets suivants:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Maintenant, le fait que j'utilise le SS de type I ou de type II fait une différence (je sais que certaines personnes s'opposent aux termes types I et II, etc., mais étant donné la popularité de SAS, c'est un raccourci facile). R anova {stats} utilise le type I par défaut. Je peux calculer les densités de type II SS, F et P en inversant l'ordre de mes effets principaux ou utiliser le package "car" du Dr. John Fox (accompagnement de la régression appliquée). Je préfère cette dernière méthode car elle est plus facile pour les problèmes plus complexes.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
D'après ce que je comprends, les hypothèses de type II seraient les suivantes: "Il n'y a pas d'effet linéaire de x1 sur y1 étant donné l'effet de (maintien constant?) X2" et il en va de même pour x2 étant donné x1. Je suppose que c'est là que je me perds. Quelle est l'hypothèse testée par l'ANOVA en utilisant la méthode de type I (séquentielle) ci-dessus par rapport à l'hypothèse en utilisant la méthode de type II?
En réalité, mes données sont un peu plus complexes, car j’ai mesuré de nombreuses mesures de la croissance des plantes ainsi que de la dynamique des éléments nutritifs et de la décomposition de la litière. Mon analyse actuelle est quelque chose comme:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16