J'ai parcouru plusieurs livres (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill, etc.) et plusieurs articles (Gelman, Jusko, Primo & Jacobsmeier, etc.), et je n'ai toujours pas vraiment fait le tour de ma tête les principales différences entre l'utilisation d'erreurs standard groupées et la modélisation à plusieurs niveaux.
Je comprends les parties qui ont à voir avec la question de recherche à portée de main; il existe certains types de réponses que vous ne pouvez obtenir qu'à partir de la modélisation à plusieurs niveaux. Cependant, par exemple, pour un modèle à deux niveaux où vos coefficients d'intérêt ne sont qu'au deuxième niveau, quel est l'avantage de faire une méthode par rapport à l'autre? Dans ce cas, je ne suis pas inquiet de faire des prédictions ou d'extraire des coefficients individuels pour les clusters.
La principale différence que j'ai pu trouver est que les erreurs standard groupées souffrent lorsque les clusters ont des tailles d'échantillon inégales et que la modélisation à plusieurs niveaux est faible en ce qu'elle suppose une spécification de la distribution aléatoire des coefficients (alors que l'utilisation des erreurs standard groupées est sans modèle) .
Et en fin de compte, tout cela signifie-t-il que pour les modèles qui pourraient ostensiblement utiliser l'une ou l'autre méthode, nous devrions obtenir des résultats similaires en termes de coefficients et d'erreurs standard?
Toute réponse ou ressource utile serait grandement appréciée.