Quelle interprétation ont les paramètres d'un modèle linéaire généralisé avec codage d'effet?


9
library(lme4)
    out <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.sum"))

summary(out)
Fixed effects:
            Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.32337    0.22129 -10.499  < 2e-16 ***
period1      0.92498    0.18330   5.046 4.51e-07 ***
period2     -0.06698    0.22845  -0.293    0.769
period3     -0.20326    0.24193  -0.840    0.401

Je n'ai jamais été dans une situation où je devais adapter un modèle linéaire généralisé avec codage d'effet ( contr.sumpour les Rutilisateurs). Puis-je appliquer la même interprétation que dans le cas du modèle linéaire? Dans un modèle linéaire normal , l'interception serait la moyenne générale et la de paramètres (pour , , et les effets à savoir la façon dont les niveaux de facteur dévient de la moyenne générale .βperiod1period2period3period4 = (Intercept) - period1 - period2 - period3

Voici comment je pense que l'interprétation analogue des modèles linéaires généralisés va. (Je vais exposer tous les paramètres et donc transformer les log-odds (-ratios) en odds (-ratios).) L'interception serait alors la cote globale de réussite vs échec ( s'en tenir ici à la terminologie binomiale classique) et aux s les log-odds-ratios . Et nous obtenons les chances par exemple en ajoutant puis en exponentiant: . Le vraiment les ensemble / moyen de cotes et les sexp((Intercept))βperiod1(Intercept)+period1exp((Intercept)+period1)(Intercept)βrapports de cotes ?

Réponses:


3

Sous le codage d'effet, l'ordonnée à l'origine dans le résumé du tableau récapitulatif (out) est le logit moyen (log-odds ou log of odds ratio) sur les quatre périodes de votre cas, et chacun des autres effets est la différence logit du période correspondante par rapport au logit moyen.

Vous pouvez facilement vérifier votre interprétation en comparant vos résultats actuels à une méthode de codage différente telle que le codage factice sur vos données:

out2 <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.treatment"))

summary(out2)

1
Je dirais que l'ordonnée à l'origine n'est pas un rapport de cotes mais plutôt les cotes moyennes et que seuls les coefficients ( ) sont des rapports de cotes . Le vous donne les cotes moyennes (après exponentiation) et lorsque vous ajoutez le rapport log-odds de par exemple aux cotes de log de et exponentiate cette somme alors vous avez des chances pour . Je pense qu'il est important de vraiment garder les odds-ratios et les odds à part. Le premier est un rapport entre les probabilités, les seconds sont les probabilités de réussite par rapport à l'échec (dans un modèle binomial).β(Intercept)period1(Intercept)period1
lord.garbage

Pet votre commentaire, j'ai édité un peu ma réponse. Voyez si c'est mieux maintenant.
bluepole
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.