Selon la documentation de l' objet StandardScaler dans scikit-learn:
Par exemple, de nombreux éléments utilisés dans la fonction objective d'un algorithme d'apprentissage (comme le noyau RBF des machines à vecteurs de support ou les régularisateurs L1 et L2 des modèles linéaires) supposent que toutes les fonctionnalités sont centrées autour de 0 et ont des variances dans le même ordre. Si une caractéristique présente une variance de plusieurs ordres de grandeur plus grande que d'autres, elle pourrait dominer la fonction objective et empêcher l'estimateur d'apprendre correctement des autres caractéristiques comme prévu.
Je devrais mettre à l'échelle mes fonctionnalités avant la classification. Existe-t-il un moyen simple de montrer pourquoi je dois le faire? Des références à des articles scientifiques seraient encore meilleures. J'en ai déjà trouvé un mais il y en a probablement beaucoup d'autres.