Je me demandais si quelqu'un avait de l'expérience avec la fonction souris, comme décrit dans Souris: Imputation multivariée par équations chaînées dans R (JSS 2011 45 (3))? J'ai un ensemble de données avec un certain nombre de variables, chacune avec différents degrés de données manquantes.
Ma question principale est: disons que j'utilise la régression linéaire bayésienne pour imputer les données manquantes, mice
utilise- t-il automatiquement les variables prédictives de la plus significative à la moins significative pour imputer? Est-il également courant de faire la moyenne de tous les ensembles de données imputés?