Comparaison des modèles à effets mixtes et à effets fixes (test de l'importance des effets aléatoires)

Étant donné trois variables, yet xqui sont positives continues et zqui sont catégoriques, j'ai deux modèles candidats donnés par:

fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )

fit.fe <- lm( y ~ 1 + x )

J'espère comparer ces modèles pour déterminer quel modèle est le plus approprié. Il me semble que dans un certain sens fit.feest imbriqué à l'intérieur fit.me. En règle générale, lorsque ce scénario général se vérifie, un test du chi carré peut être effectué. Dans R, nous pouvons effectuer ce test avec la commande suivante,

anova(fit.fe,fit.me)

Lorsque les deux modèles contiennent des effets aléatoires (générés par à lmerpartir du lme4package), la anova()commande fonctionne correctement. En raison des paramètres aux limites, il est normalement conseillé de tester la statistique du chi carré résultant par simulation, néanmoins, nous pouvons toujours utiliser la statistique dans la procédure de simulation.

Lorsque les deux modèles ne contiennent que des effets fixes, cette approche --- et, la anova()commande associée --- fonctionnent correctement.

Cependant, lorsqu'un modèle contient des effets aléatoires et que le modèle réduit ne contient que des effets fixes, comme dans le scénario ci-dessus, la anova()commande ne fonctionne pas.

Plus précisément, j'obtiens l'erreur suivante:

 > anova(fit.fe, fit.me)
 Error: $ operator not defined for this S4 class

Y a-t-il quelque chose de mal à utiliser l'approche Chi-Square d'en haut (avec simulation)? Ou est-ce simplement un problème de anova()ne pas savoir comment gérer les modèles linéaires générés par différentes fonctions?

En d'autres termes, serait-il approprié de générer manuellement la statistique du chi carré dérivée des modèles? Si oui, quels sont les degrés de liberté appropriés pour comparer ces modèles? Par mes calculs:

F = \frac{((S S E_{r e ré u c e ré} - S S E_{F u l l}) / (p - k))}{((S S E_{F u l l}) / (n - p - 1))} \sim F_{p - k, n - p - 1}

$F = \frac{\left((SSE_{reduced}-SSE_{full})/(p-k)\right)}{\left((SSE_{full})/(n-p-1)\right)} \sim F_{p-k,n-p-1}$

Nous estimons deux paramètres dans le modèle à effets fixes (pente et interception) et deux autres paramètres (paramètres de variance pour la pente aléatoire et interception aléatoire) dans le modèle à effets mixtes. En règle générale, le paramètre d'interception n'est pas compté dans le calcul des degrés de liberté, ce qui implique que et ; cela dit, je ne sais pas si les paramètres de variance pour les paramètres à effets aléatoires doivent être inclus dans le calcul des degrés de liberté; les estimations de la variance pour les paramètres à effet fixe ne sont pas prises en compte , mais je pense que c'est parce que les estimations des paramètres pour les effets fixes sont supposées être des constantes inconnues alors qu'elles sont considérées comme des variables aléatoires inconnaissables $k=1$ $p=k+2=3$ pour des effets mixtes. J'apprécierais une aide sur cette question.

Enfin, quelqu'un a-t-il une Rsolution plus appropriée ( basée sur) pour comparer ces modèles?

r hypothesis-testing mixed-model lme4-nlme

— user9171
source

Si vous remplacez lm()par à gls()partir du nlmepackage, et lmer()par lme()(à nouveau à partir du nlmepackage), tout fonctionnera correctement. Mais notez que vous obtiendrez un test conservateur ( valeurs de p trop grandes ), car les paramètres du modèle plus simple se trouvent à la limite de l'espace des paramètres. Et vraiment, le choix d'inclure ou non les effets aléatoires devrait être basé sur la théorie (par exemple, le plan d'échantillonnage), pas sur un test statistique.

— Karl Ove Hufthammer

Que voulez-vous faire avec les modèles? Un modèle peut être meilleur à certaines fins et l'autre modèle meilleur à d'autres fins. Tous les modèles sont faux, donc la question n'est pas de savoir quel modèle est le bon, mais lequel est plus utile pour votre problème particulier.

— Kodiologist

@Kodiologist En gros, je veux m'assurer que les estimations des paramètres pour les effets fixes sont fiables. Les erreurs-types peuvent ne pas être fiables si les observations sont supposées indépendantes. De plus, il serait bien de faire une déclaration sur la façon dont la variable est l'effet aléatoire, mais je suppose que ce n'est pas aussi essentiel.

— user9171

@ user9171 Un bon moyen de vérifier la stabilité (fiabilité) dans les estimations de paramètres d'un modèle consiste à utiliser le bootstrap. Représentez graphiquement les distributions d'amorçage pour chaque paramètre partagé par les deux modèles, avec un graphique par paramètre et modèle. Des distributions plus serrées impliquent une stabilité plus élevée. Vous constaterez probablement que le modèle plus simple donne des estimations plus stables, car moins de paramètres permettent une estimation plus précise de chaque paramètre.

— Kodiologist

Techniquement, vous pouvez le faire fonctionner en changeant simplement l'ordre des paramètres:

> anova(fit.me, fit.fe)

Fonctionnera très bien. Si vous passez un objet généré par lmerfirst, le anova.merModsera appelé à la place de anova.lm(qui ne sait pas comment gérer les lmerobjets). Voir:

?anova.merMod

Bien que le choix d'un modèle mixte ou d'un modèle fixe soit un choix de modélisation qui doit prendre en compte la conception expérimentale, pas un problème de sélection de modèle. Voir https://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#testing-significance-of-random-effects @ BenBolker pour plus de détails:

Envisagez de ne pas tester la signification des effets aléatoires.

— witek
source

+1. J'ai pris la liberté d'insérer un lien vers la FAQ de @ BenBolker qui contient d'autres discussions et références.

— amoeba