L'inclusion de termes aléatoires dans le modèle est un moyen d'induire une structure de covariance entre les notes. Le facteur aléatoire pour l'école induit une covariance non nul entre les différents élèves de la même école, alors qu'il est quand l'école sont différents.0
Écrivons votre modèle comme
où s indexe l'école et i indexe les élèves (dans chaque école). Les termes écoles s sont des variables aléatoires indépendantes dessinées dans un N ( 0 , τ ) . Les e s , i sont des variables aléatoires indépendantes dessinées dans un N ( 0 , σ
Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,i .
N(0,σ2)
Ce vecteur a une valeur attendue
qui est déterminée par le nombre d'heures travaillées.
[α+hourss,iβ]s,i
La covariance entre et Y s ′ , i ′ est 0 lorsque sYs,iYs′,i′0 , ce qui signifie que l'écart des notes par rapport aux valeurs attendues est indépendant lorsque les élèves ne sont pas dans la même école.s≠s′
La covariance entre et Y s , iYs,i estτlorsquei≠i′, et la variance deY s , i estτYs,i′τi≠i′Ys,i : les notes des élèves d'une même école auront des écarts corrélés par rapport à leurs valeurs attendues .τ+σ2
Exemple et données simulées
Voici une courte simulation R pour cinquante élèves de cinq écoles (ici je prends ); les noms de la variable sont auto-documentés: σ2=τ=1
set.seed(1)
school <- rep(1:5, each=10)
school_effect <- rnorm(5)
school_effect_by_ind <- rep(school_effect, each=10)
individual_effect <- rnorm(50)
schools+es,i
plot(individual_effect + school_effect_by_ind, col=school, pch=19,
xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)
schoolsα+hoursβ
La matrice de variance pour cet exemple
schoolses,i
⎡⎣⎢⎢⎢⎢⎢⎢A00000A00000A00000A00000A⎤⎦⎥⎥⎥⎥⎥⎥
10×10AA=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥.