Diverses descriptions sur la sélection des modèles sur les effets aléatoires des modèles mixtes linéaires indiquent l'utilisation de REML. Je connais la différence entre REML et ML à un certain niveau, mais je ne comprends pas pourquoi REML devrait être utilisé parce que ML est biaisé. Par exemple, est-ce mal de conduire un TLR sur un paramètre de variance d'un modèle de distribution normal en utilisant ML (voir le code ci-dessous)? Je ne comprends pas pourquoi il est plus important d'être impartial que d'être ML, dans la sélection des modèles. Je pense que la réponse ultime doit être "parce que la sélection de modèle fonctionne mieux avec REML qu'avec ML" mais j'aimerais en savoir un peu plus. Je n'ai pas lu les dérivations de LRT et AIC (je ne suis pas assez bon pour les comprendre à fond), mais si REML est explicitement utilisé dans les dérivations, sachant simplement que ce sera réellement suffisant (par exemple,
n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)
loglik1 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
-sum(dnorm(y,a+b*x,alpha,log=T))
}
loglik2 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
beta <- p[4]
-sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}
m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value