Utilisez GEE lorsque vous souhaitez découvrir l'effet moyen d'une covariable sur la population par rapport à l'effet spécifique individuel. Ces deux choses ne sont équivalentes que dans les modèles linéaires, mais pas dans les non-linéaires (par exemple, la logistique). Pour le voir, prenons par exemple le modèle logistique à effets aléatoires de la ième observation du ième sujet, ;jiYij
log(pij1−pij)=μ+ηi
où est un effet aléatoire pour le sujet et .ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
Si vous utilisiez un modèle à effets aléatoires sur ces données, vous obtiendrez une estimation de qui prend en compte le fait qu’une perturbation moyenne nulle répartie a été appliquée à chaque individu, le rendant ainsi spécifique.μ
Si vous utilisiez GEE sur ces données, vous estimeriez la cote moyenne du journal de la population. Dans ce cas, ce serait
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , en général. Par exemple, si et , alors . Bien que les effets aléatoires aient une moyenne nulle sur l' échelle transformée (ou liée ), leur effet n'est pas égal à zéro sur l'échelle initiale des données. Essayez de simuler des données à partir d'un modèle de régression logistique à effets mixtes et de comparer la moyenne au niveau de la population avec le logit inverse de l'interception et vous verrez qu'elles ne sont pas égales, comme dans cet exemple. Cette différence dans l'interprétation des coefficients est la différence fondamentale entre les modèles GEE et à effets aléatoires .μ=1σ2=1ν≈.83
Éditer: En général, un modèle à effets mixtes sans prédicteur peut être écrit comme
ψ(E(Yij|ηi))=μ+ηi
où est une fonction de liaison. N'importe quandψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
il y aura une différence entre les coefficients moyens de la population (GEE) et les coefficients spécifiques individuels (modèles à effets aléatoires). En d’autres termes, les moyennes changent en transformant les données, en intégrant les effets aléatoires sur l’échelle transformée, puis en les transformant. Notez que dans le modèle linéaire (c’est-à-dire ), l’égalité est valable, elles sont donc équivalentes.ψ(x)=x
Edit 2: Il convient également de noter que les erreurs types "robustes" de type sandwich générées par un modèle GEE fournissent des intervalles de confiance asymptotiques valides (ils couvrent en fait 95% du temps), même si la structure de corrélation spécifiée dans le modèle n'est pas correcte. correct.
Edit 3: Si votre intérêt est de comprendre la structure des associations dans les données, les estimations GEE des associations sont notoirement inefficaces (et parfois incohérentes). J'ai vu une référence pour cela mais je ne peux pas la placer pour le moment.