Au premier niveau, je pense que vous ignorez tout le rétrécissement vers les valeurs de la population; " les pentes et les intersections par sujet du modèle à effets mixtes sont plus proches des estimations de la population que les estimations des moindres carrés au sein du sujet. " [réf. 1]. Le lien suivant sera probablement également utile ( Quelles sont les descriptions appropriées à regarder pour mes modèles mixtes? ), Voir la réponse de Mike Lawrence).
De plus, je pense que votre exemple de jouet est légèrement malchanceux parce que vous avez un design parfaitement équilibré qui vous fait avoir exactement la même estimation dans le cas où aucune valeur n'est manquante.
Essayez le code suivant qui a le même processus sans aucune valeur manquante maintenant:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Où maintenant, parce que votre conception n'est pas parfaitement équilibrée, vous n'avez pas les mêmes estimations de coefficient.
En fait, si vous jouez avec votre modèle de valeur manquante de manière idiote (donc par exemple:) y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
afin que votre conception soit toujours parfaitement équilibrée, vous obtiendrez à nouveau les mêmes coefficients.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Vous êtes légèrement mal orienté par la conception parfaite de votre expérience originale. Lorsque vous avez inséré les NA dans un espace non équilibré, vous avez changé le schéma de la quantité de «force» que les sujets individuels pouvaient emprunter les uns aux autres.
En bref, les différences que vous voyez sont dues à des effets de rétrécissement et plus précisément parce que vous avez déformé votre conception d'origine parfaitement équilibrée avec des valeurs manquantes non parfaitement équilibrées.
Réf 1: Douglas Bates lme4: Modélisation à effets mixtes avec R , pages 71-72
m3
il est 0,0011713" au lieu dem2
.