Voici un exemple où un modèle multiniveau pourrait être "essentiel". Supposons que vous souhaitiez évaluer la "qualité" de l'enseignement fourni par un ensemble d'écoles utilisant les résultats des tests des élèves. Une des façons de définir la qualité de l’école est la performance moyenne des tests après prise en compte des caractéristiques des élèves. Vous pouvez conceptualisé ce que,
où y i s est le score de test en continu pour les étudiants i à l' école s , X i s
yis=αs+X′isβs+ϵis,
yisisXissont étudiants attributs centré au moyen de l' école,
est un coefficient spécifique à l' école sur ces attributs,
α s est un « effet école » qui mesure la qualité de l' école, et
ε i s sont idiosyncrasies de niveau des élèves test prenant performance. L' intérêt se concentre ici sur l' estimation du
α s de l », qui mesurent la « valeur ajoutée » que l'école offre aux étudiants une fois leurs attributs sont comptabilisés-pour. Vous voulez prendre en compte les attributs des étudiants, car vous ne voulez pas punir une bonne école qui doit traiter certains élèves avec des désavantages. Par conséquent, les résultats moyens des tests sont déprimants, ce qui laisse de côté la "valeur ajoutée" élevée que l'école fournit à ses étudiants.
βsαsϵisαs
Avec le modèle en main, l'enjeu devient un problème d'estimation. Si vous avez beaucoup d'écoles et beaucoup de données pour chaque école, les belles propriétés d'OLS (voir Angrist et Pischke, Mostly Harmless ..., pour un examen en cours), suggérez que vous souhaitiez l’utiliser, avec les ajustements appropriés aux erreurs types pour tenir compte des dépendances, et l’utilisation de variables nominales et d’interactions pour obtenir des effets au niveau de l’école et des intersections spécifiques à l’école. Les MCO peuvent être inefficaces, mais ils sont si transparents qu'il pourrait être plus facile de convaincre un public sceptique si vous l'utilisiez. Mais si vos données sont rares de certaines manières - en particulier si vous avez peu d'observations pour certaines écoles - vous voudrez peut-être imposer plus de "structure" au problème. Vous voudrez peut-être «emprunter de la force» auprès des écoles de l'échantillon plus important pour améliorer les estimations bruitées que vous obtiendriez dans les écoles de l'échantillon restreint si l'estimation était réalisée sans structure. Ensuite, vous pouvez vous tourner vers un modèle à effets aléatoires estimé via FGLS,
Dans cet exemple, l’utilisation d’un modèle à plusieurs niveaux (quelle que soit notre décision finale) est motivée par l’intérêt direct suscité par les interceptions au niveau de l’école. Bien entendu, dans d’autres situations, ces paramètres de niveau groupe ne sont peut-être qu’une nuisance. Que vous deviez ou non vous y adapter (et donc travailler avec un type de modèle à plusieurs niveaux) dépend de la validité de certaines hypothèses d'exogénéité conditionnelle. À ce sujet, je recommanderais de consulter la littérature économétrique sur les méthodes de données de panel; la plupart des idées qui en découlent sont ensuite transférées dans des contextes de données groupées générales.