J'ai un problème de classification (de classe ), avec de l'ordre de 100 prédicteurs à valeur réelle, dont l'un semble avoir beaucoup plus de pouvoir explicatif que les autres. Je voudrais approfondir les effets des autres variables. Cependant, les techniques standard d'apprentissage automatique (forêts aléatoires, SVM, etc.) semblent être submergées par l'un prédicteur fort et ne me donnent pas beaucoup d'informations intéressantes sur les autres.
S'il s'agissait d'un problème de régression, je régresserais simplement contre le prédicteur fort, puis j'utiliserais les résidus comme entrées pour d'autres algorithmes. Je ne vois pas vraiment comment cette approche peut être traduite dans un contexte de classification.
Mon instinct est que ce problème doit être raisonnablement courant: existe-t-il une technique standard pour y faire face?