Bonjour, j'ai deux problèmes qui sonnent comme des candidats naturels pour les modèles multiniveaux / mixtes, que je n'ai jamais utilisés. La plus simple et que j'espère essayer en introduction est la suivante: les données ressemblent à de nombreuses lignes du formulaire
x y innergroup outergroup
où x est une covariable numérique sur laquelle je veux régresser y (une autre variable numérique), chaque y appartient à un groupe interne et chaque groupe interne est imbriqué dans un groupe externe (c'est-à-dire que tous les y dans un groupe interne donné appartiennent au même groupe externe) . Malheureusement, le groupe interne a beaucoup de niveaux (plusieurs milliers), et chaque niveau a relativement peu d'observations de y, donc j'ai pensé que ce type de modèle pourrait être approprié. Mes questions sont
Comment puis-je écrire ce type de formule à plusieurs niveaux?
Une fois lmer adapté au modèle, comment s'y prendre pour en prévoir? J'ai ajusté quelques exemples de jouets plus simples, mais je n'ai pas trouvé de fonction Predict (). La plupart des gens semblent plus intéressés par l'inférence que par la prédiction avec ce type de technique. J'ai plusieurs millions de lignes, donc les calculs peuvent être un problème, mais je peux toujours les réduire selon les besoins.
Je n'aurai pas besoin de faire la seconde pendant un certain temps, mais je pourrais aussi bien commencer à y penser et à jouer avec. J'ai des données similaires à celles d'avant, mais sans x, et y est maintenant une variable binomiale de la forme . y présente également beaucoup de surdispersion, même au sein des groupes internes. La plupart des ne dépassent pas 2 ou 3 (ou moins), donc pour obtenir des estimations des taux de réussite de chaque y_i, j'ai utilisé l'estimateur de rétrécissement bêta-binomial (\ alpha + k_i) / (\ alpha + \ beta + n_i) , où \ alpha et \ betan y i ( α + k i ) / ( α + β + n i ) α βsont estimés par MLE pour chaque groupe interne séparément. Cela a été quelque peu adéquat, mais la rareté des données me tourmente, donc je voudrais utiliser toutes les données disponibles. D'un point de vue, ce problème est plus facile car il n'y a pas de covariable, mais de l'autre la nature binomiale le rend plus difficile. Quelqu'un a-t-il des conseils de haut niveau (ou bas!)?