J'ai deux questions sur l'utilisation de la forêt aléatoire (spécifiquement randomForest dans R) pour l'imputation des valeurs manquantes (dans l'espace des prédicteurs).
1) Comment fonctionne l'algorithme d'imputation - en particulier comment et pourquoi l'étiquette de classe est-elle requise pour l'imputation? la matrice de proximité qui sert à pondérer la valeur moyenne pour imputer une valeur manquante est-elle définie séparément par classe?
2) Si l'étiquette de classe est nécessaire pour imputer des valeurs manquantes - comment peut-elle être utilisée pour imputer des valeurs manquantes pour de nouvelles données que vous essayez de prédire?