J'espère que c'est une question à laquelle quelqu'un ici peut répondre pour moi sur la nature de la décomposition des sommes de carrés à partir d'un modèle à effets mixtes lmer
(à partir du package lme4 R).
Tout d'abord, je dois dire que je suis conscient de la controverse liée à l'utilisation de cette approche et, dans la pratique, je serais plus susceptible d'utiliser un TLR amorcé pour comparer les modèles (comme suggéré par Faraway, 2006). Cependant, je suis perplexe sur la façon de reproduire les résultats, et donc pour ma propre raison, j'ai pensé demander ici.
Fondamentalement, je commence à utiliser des modèles à effets mixtes adaptés au lme4
package. Je sais que vous pouvez utiliser la anova()
commande pour donner un résumé des tests séquentiels des effets fixes dans le modèle. Autant que je sache, c'est ce que Faraway (2006) appelle l'approche des «carrés moyens attendus». Ce que je veux savoir, c'est comment sont calculées les sommes des carrés?
Je sais que je pourrais prendre les valeurs estimées d'un modèle particulier (en utilisant coef()
), supposer qu'elles sont fixes, puis faire des tests en utilisant les sommes des carrés des résidus du modèle avec et sans les facteurs d'intérêt. C'est très bien pour un modèle contenant un seul facteur intra-sujet. Cependant, lors de la mise en œuvre d'une conception à parcelles divisées, la valeur des sommes des carrés que j'obtiens est équivalente à la valeur produite par R en utilisant aov()
une Error()
désignation appropriée . Cependant, ce n'est pas la même chose que les sommes des carrés produites par la anova()
commande sur l'objet modèle, malgré le fait que les rapports F sont les mêmes.
Bien sûr, cela est tout à fait logique car il n'est pas nécessaire pour les Error()
strates dans un modèle mixte. Cependant, cela doit signifier que les sommes des carrés sont pénalisées d'une manière ou d'une autre dans un modèle mixte afin de fournir des ratios F appropriés. Comment y parvient-on? Et comment le modèle corrige-t-il en quelque sorte la somme des carrés entre les parcelles, mais pas la somme des carrés intra-parcelles. Évidemment, c'est quelque chose qui est nécessaire pour une ANOVA à parcelles divisées classique qui a été obtenue en désignant différentes valeurs d'erreur pour les différents effets, alors comment un modèle à effets mixtes permet-il cela?
Fondamentalement, je veux pouvoir reproduire anova()
moi-même les résultats de la commande appliquée à un objet de modèle lmer pour vérifier les résultats et ma compréhension, mais pour le moment, je peux y parvenir pour une conception intra-sujet normale, mais pas pour le fractionnement. la conception de l'intrigue et je n'arrive pas à comprendre pourquoi c'est le cas.
Par exemple:
library(faraway)
library(lme4)
data(irrigation)
anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation))
Analysis of Variance Table
Df Sum Sq Mean Sq F value
irrigation 3 1.6605 0.5535 0.3882
variety 1 2.2500 2.2500 1.5782
summary(aov(yield ~ irrigation + variety + Error(field/irrigation), data = irrigation))
Error: field
Df Sum Sq Mean Sq F value Pr(>F)
irrigation 3 40.19 13.40 0.388 0.769
Residuals 4 138.03 34.51
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
variety 1 2.25 2.250 1.578 0.249
Residuals 7 9.98 1.426
Comme on peut le voir ci-dessus, les ratios F sont tous d'accord. Les sommes des carrés pour la variété sont également d'accord. Cependant, les sommes des carrés pour l'irrigation ne sont pas d'accord, mais il semble que la sortie de lmer soit mise à l'échelle. Alors, que fait réellement la commande anova ()?
mixed()
deafex
qui offre ce que vous voulez (viamethod = "PB"
). Et comme vous avez évidemment fait des tests avec des données de jouets, il serait certainement utile de montrer ces équivalences avec les données et le code (donc pas de +1).