Je voudrais des conseils sur la mise en commun des tracés / statistiques d'étalonnage après imputation multiple. Dans le cadre du développement de modèles statistiques afin de prédire un événement futur (par exemple en utilisant les données des dossiers hospitaliers pour prédire la survie ou les événements après la sortie de l'hôpital), on peut imaginer qu'il y a trop d'informations manquantes. L'imputation multiple est un moyen de gérer une telle situation, mais entraîne la nécessité de regrouper les statistiques des tests de chaque ensemble de données d'imputation en tenant compte de la variabilité supplémentaire due à l'incertitude inhérente à l'imputation.
Je comprends qu'il existe plusieurs statistiques d'étalonnage (hosmer-lemeshow, Harrell's Emax, indice d'étalonnage estimé, etc.), pour lesquelles les règles Rubin `` régulières '' de mise en commun peuvent s'appliquer.
Cependant, ces statistiques sont souvent des mesures globales de calibration qui ne montrent pas de régions spécifiques mal calibrées du modèle. Pour cette raison, je préfère regarder un tracé d'étalonnage. Malheureusement, je ne sais pas comment `` mettre en commun '' les parcelles ou les données qui les sous-tendent (probabilités prédites par individu et résultats observés par individu), et je ne trouve pas grand-chose dans la littérature biomédicale (le domaine que je connais), ou ici, sur CrossValidated. Bien sûr, regarder le tracé d'étalonnage de chaque jeu de données d'imputation pourrait être une réponse, mais pourrait devenir assez gênant (à présenter) lorsque de nombreux ensembles d'imputation sont créés.
Je voudrais donc demander s'il existe des techniques qui aboutiraient à un tracé d'étalonnage, regroupées après imputation multiple (?)