En termes d'interprétation des coefficients, il y a une différence dans le cas binaire (entre autres). Ce qui diffère entre GEE et GLMM est la cible de l'inférence: moyenne de la population ou spécifique au sujet .
Prenons un exemple inventé simple lié au vôtre. Vous voulez modéliser le taux d'échec entre les garçons et les filles dans une école. Comme dans la plupart des écoles (élémentaires), la population des élèves est divisée en salles de classe. Vous observez une réponse binaire de n i enfants en N classes (ie Σ N i = 1 n i réponses binaires groupées par classe), où Y i j = 1 si l' étudiant j de classe i passé et Y i j = 0 s'il /elle a échoué. Et xYniN∑Ni=1niYij=1jiYij=0si l'élèvejde la classeiest un homme et 0 sinon.xij=1ji
Pour reprendre la terminologie que j'ai utilisée dans le premier paragraphe, vous pouvez considérer l'école comme étant la population et les salles de classe comme étant les matières .
Considérons d'abord GLMM. GLMM ajuste un modèle à effets mixtes. Les conditions du modèle sur la matrice de conception fixe (qui dans ce cas se compose de l'ordonnée à l'origine et de l'indicateur de genre) et tout effet aléatoire parmi les salles de classe que nous incluons dans le modèle. Dans notre exemple, incluons une interception aléatoire, , qui prendra en compte les différences de base dans le taux d'échec entre les salles de classe. Nous modélisons doncbi
log(P(Yij=1)P(Yij=0)∣xij,bi)=β0+β1xij+bi
Le rapport de cotes du risque d'échec dans le modèle ci-dessus diffère en fonction de la valeur de qui est différente entre les salles de classe. Ainsi, les estimations sont spécifiques au sujet .bi
GEE, d'autre part, correspond à un modèle marginal. Ces moyennes de population du modèle . Vous modélisez l'attente conditionnelle uniquement à votre matrice de conception fixe.
log(P(Yij=1)P(Yij=0)∣xij)=β0+β1xij
Cela contraste avec les modèles à effets mixtes comme expliqué ci-dessus qui conditionnent à la fois la matrice de conception fixe et les effets aléatoires. Donc, avec le modèle marginal ci-dessus, vous dites: «oubliez la différence entre les salles de classe, je veux juste le taux d'échec de la population (au niveau de l'école) et son association avec le sexe». Vous ajustez le modèle et obtenez un rapport de cotes qui est le rapport de cotes moyen de la population de l'échec associé au sexe.
Ainsi, vous pouvez constater que vos estimations de votre modèle GEE peuvent différer vos estimations de votre modèle GLMM et c'est parce qu'ils n'évaluent pas la même chose.
(En ce qui concerne la conversion du log-odds-ratio en odds-ratio en exponentiant, oui, vous le faites que ce soit une estimation au niveau de la population ou du sujet)
Quelques notes / littérature:
Pour le cas linéaire, les estimations de la population moyenne et des sujets sont les mêmes.
Zeger et al. 1988 a montré que pour la régression logistique,
βM≈[(163√15π)2V+1]−1/2βRE
βMβREV
Molenberghs, Verbeke 2005 contient un chapitre entier sur les modèles à effets marginaux et aléatoires.
J'ai pris connaissance de ce sujet et du matériel connexe dans un cours basé beaucoup sur Diggle, Heagerty, Liang, Zeger 2002 , une excellente référence.