Interprétation de la variance à effet aléatoire dans glmer


13

Je révise un document sur la pollinisation, où les données sont distribuées de façon binomiale (le fruit mûrit ou non). J'ai donc utilisé glmerun effet aléatoire (plante individuelle) et un effet fixe (traitement). Un critique veut savoir si la plante a eu un effet sur la nouaison - mais j'ai du mal à interpréter les glmerrésultats.

J'ai lu sur le Web et il semble qu'il puisse y avoir des problèmes avec la comparaison directe glmet les glmermodèles, donc je ne le fais pas. J'ai pensé que la façon la plus simple de répondre à la question serait de comparer la variance à effet aléatoire (1,449, ci-dessous) à la variance totale, ou la variance expliquée par le traitement. Mais comment calculer ces autres variances? Ils ne semblent pas être inclus dans la sortie ci-dessous. J'ai lu quelque chose sur les variances résiduelles non incluses pour le binôme glmer- comment interpréter l'importance relative de l'effet aléatoire?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

Réponses:


12

Bien qu'il soit en principe possible d' obtenir un analogue de la "variance proportionnelle expliquée par chaque effet" pour les GLMM, il existe plusieurs facteurs de complication (quels niveaux du modèle considérez-vous comme "variance totale" et comment quantifiez-vous la variation d'échantillonnage due à la distribution d'échantillonnage la plus basse [binomiale dans ce cas])? Nakagawa et Schielzeth (doi: 10.1111 / j.2041-210x.2012.00261.x) présentent une approche générale du calcul de R ^ 2 (proportion de la variance totale expliquée) pour les (G) LMM qui sont devenus assez populaires en écologie; Xu et al 2003adopter une approche similaire. En principe, cette approche pourrait probablement être étendue pour tenir compte de la proportion de variance expliquée par des termes différents [mais notez que la «proportion de variance» de tous les termes du modèle considéré de cette manière ne totaliserait probablement pas 100% - elle pourrait soit plus ou moins].

4σ-1,96σ+1,96σ

Visuellement:

entrez la description de l'image ici


R2

1
Je disais simplement que je ne pense pas que ce soit une question folle ou nécessairement mal posée. Mais la structure hiérarchique et les modèles de type GLM ouvrent des boîtes de vers qui rendent plus difficile le choix d'une réponse. Je ne me dérange généralement pas, mais je peux voir pourquoi les gens voudraient essayer de trouver des nombres qui mesurent la qualité de l'ajustement ou l'importance relative des termes dans un modèle, d'une manière raisonnable.
Ben Bolker

C'est raisonnable. Au fait, que pensez-vous de ma suggestion selon laquelle avec 10 plantes, 3 traitements et N = 30, l'OP pourrait s'adapter à un modèle utilisant les deux comme effets fixes? Je ne pense pas nécessairement que ce serait le bon modèle final, bien sûr, mais cela me semble être un moyen potentiellement admissible de tester s'il y a une variation entre les plantes, et de mettre les deux variables sur un pied similaire pour comparaison.
gung - Réintègre Monica

me semble raisonnable.
Ben Bolker

J'ai ajusté un modèle avec à la fois le traitement et la plante comme effets fixes comme le suggérait le gung, et le terme plante avait une valeur de p très élevée (p = 0,3). Cela semble-t-il étrange étant donné que, comme vous le dites, "l'écart type estimé entre les usines est de 1,20, très proche de l'ampleur du plus grand effet de traitement (-1,18)"? Pourquoi apparaîtrait-il comme insignifiant dans une ANOVA avec 2 effets fixes?
jwb4

3

PlantID0

Dans votre cas, vous avez plusieurs mesures par plante, donc une approche rapide et sale consiste à exécuter un modèle avec PlantIDun effet fixe et à tester cet effet.


1

La réponse simple à votre critique est «Oui». S'il vous demande de tester si la variance de l'effet aléatoire est significativement différente de 0, vous avez deux options. Notez cependant que de nombreuses personnes intelligentes sont mal à l'aise de tester si les variances des effets aléatoires sont différentes de 0.

Le plus simple est un test de rapport de vraisemblance, bien qu'il ne soit pas recommandé par la plupart. Ils sont très conservateurs lors des tests aux limites (c'est-à-dire que vous testez contre une variance de 0 qui est aussi faible que possible). Il existe une règle générale selon laquelle la valeur p est environ le double de ce qu'elle est vraiment.

La méthode recommandée dans la plupart des endroits est un bootstrap paramétrique. Vous pouvez utiliser à bootMerpartir du lme4package. Assurez-vous que vous définissez le paramètre REML de votre fonction lmer sur FALSE, sinon votre variance sera supérieure à 0100% du temps (ou proche de celle-ci ... en fait, elle sera probablement supérieure à 0 près de 100% de la temps quand même).

Quelques conseils et autres ressources:

http://glmm.wikidot.com/faq (trouver la rubrique Comment puis-je tester si un effet aléatoire est significatif?)

lmer () test d'amorçage paramétrique pour les effets fixes

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


Merci pour ce guide lucide (et rapide!) De comparaison de modèles. Mais comment pourrais-je interpréter la «magnitude» de l'effet de la variable aléatoire? c'est-à-dire, comment comparer la variance expliquée par ma variable aléatoire à la variance expliquée par la variable fixe (traitement)? Je suppose que je ne vois pas comment cela est glané des résultats du test LRT amorcé.
jwb4

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.