J'ai utilisé l'imputation multiple pour obtenir un certain nombre de jeux de données terminés.
J'ai utilisé des méthodes bayésiennes sur chacun des ensembles de données terminés pour obtenir des distributions postérieures pour un paramètre (un effet aléatoire).
Comment puis-je combiner / regrouper les résultats de ce paramètre?
Plus de contexte:
Mon modèle est hiérarchique dans le sens d'élèves individuels (une observation par élève) regroupés dans les écoles. J'ai effectué plusieurs imputations (en utilisant MICE
dans R) sur mes données où j'ai inclus school
comme l'un des prédicteurs des données manquantes - pour essayer d'incorporer la hiérarchie des données dans les imputations.
J'ai ajusté un modèle de pente aléatoire simple à chacun des ensembles de données terminés (en utilisant MCMCglmm
dans R). Le résultat est binaire.
J'ai trouvé que les densités postérieures de la variance de pente aléatoire sont "bien comportées" dans le sens où elles ressemblent à ceci:
Comment puis-je combiner / regrouper les moyennes postérieures et les intervalles crédibles de chaque ensemble de données imputé, pour cet effet aléatoire?
Update1 :
D'après ce que je comprends jusqu'à présent, je pourrais appliquer les règles de Rubin à la moyenne postérieure, pour donner une moyenne postérieure multipliée imputée - y a-t-il des problèmes avec cela? Mais je ne sais pas comment je peux combiner les intervalles crédibles à 95%. De plus, étant donné que j'ai un véritable échantillon de densité postérieure pour chaque imputation - pourrais-je en quelque sorte les combiner?
Update2 :
Selon la suggestion de @ cyan dans les commentaires, j'aime beaucoup l'idée de simplement combiner les échantillons des distributions postérieures obtenues à partir de chaque ensemble de données complet à partir de l'imputation multiple. Cependant, je voudrais connaître la justification théorique de cette démarche.