Soit la réponse et le vecteur prédictif (respectivement) de l'élève i à l'école j .yij,xijij
(1) Pour les données binaires, je pense que la façon standard de faire des décompositions de variance analogues à celles faites pour les données continues est ce que les auteurs appellent la méthode D (je commenterai les autres méthodes ci-dessous) dans votre lien - imaginer les données binaires comme résultant d'une variable continue sous-jacente régie par un modèle linéaire et décomposant la variance à cette échelle latente. La raison en est que les modèles logistiques (et autres GLM) se posent naturellement de cette façon ...
Pour voir cela, définissez y⋆je j telle sorte qu'il soit régi par un modèle mixte linéaire:
y⋆je j= α + xje jβ + ηj+ εje j
où sont des coefficients de régression, η j ∼ N ( 0 , σ 2 ) est l'effet aléatoire au niveau de l'école et ε i j est le terme de variance résiduelle et a une distribution logistique standard . Maintenant, laisseα , βηj∼ N( 0 , σ2)εje j
yje j= ⎧⎩⎨⎪⎪10si y ⋆je j≥ 0si y ⋆je j< 0
Soit maintenant, en utilisant simplement le CDF logistique que nous avonspje j= P( yje j= 1 | Xje j, ηj)
pje j= 1 - P( y⋆je j<0|xij,ηj)=exp{−(α+xijβ+ηj)}1+exp{−(α+xijβ+ηj)}
prenant maintenant la transformation logit des deux côtés, vous avez
Journal( pje j1 - pje j) =α+ xje jβ + ηj
qui est exactement le modèle logistique des effets mixtes. Ainsi, le modèle logistique est équivalent au modèle de variable latente spécifié ci-dessus. Une remarque importante:
- L'échelle de n'est pas identifiée car, si vous la réduisiez mais une constante s , cela changerait simplement ce qui précède enεje js
exp{ - ( α + xje jβ + ηj)/s}1+exp{ - (α+xijβ+ηj) / s }
s = 1v a r ( εje j) = π2/ 3
Maintenant, si vous utilisez ce modèle et la quantité
σ^2ησ^2η+ π2/ 3
estime la corrélation intraclasse des variables latentes sous - jacentes . Une autre note importante:
- εje j
σ^2ησ^2η+ 1
Concernant les autres méthodes mentionnées dans l'article que vous avez lié:
Xje j
(B) La méthode de simulation fait intuitivement appel à un statisticien car elle vous donnerait une décomposition de la variance estimée sur l'échelle d'origine des données mais, selon le public, il peut (i) être compliqué de décrire cela dans vos "méthodes" et (ii) peut désactiver un examinateur qui recherchait quelque chose de "plus standard"
(C) Prétendre que les données sont continues n'est probablement pas une bonne idée, bien que cela ne fonctionnera pas terriblement si la plupart des probabilités ne sont pas trop proches de 0 ou 1. Mais, cela ferait presque certainement lever le drapeau rouge à un examinateur donc je resterais loin.
Maintenant enfin,
(2) Si les effets fixes sont très différents d'une année à l'autre, alors vous avez raison de penser qu'il pourrait être difficile de comparer les variances des effets aléatoires d'une année à l'autre, car elles sont potentiellement à différentes échelles (cela est lié à la non-identifiabilité problème de mise à l'échelle mentionné ci-dessus).
jek= 1k
α + xje jβ + η1 jje1+ η2 jje2+ η3 jje3+ η4 jje4+ η5 jje5+ η6 jje6
cela vous donnera un ICC différent chaque année mais les mêmes effets fixes. Il peut être tentant d'utiliser simplement une pente aléatoire dans le temps, ce qui rend votre prédicteur linéaire
α + xje jβ + η1+ η2t
mais je ne le recommande pas, car cela permettra uniquement à vos associations d' augmenter au fil du temps, pas de diminuer .