Quelle est votre opinion sur le suréchantillonnage dans la classification en général, et l'algorithme SMOTE en particulier? Pourquoi n'appliquerions-nous pas simplement un coût / une pénalité pour corriger le déséquilibre des données de classe et tout coût déséquilibré des erreurs? Pour mes besoins, l'exactitude de la prédiction d'un futur ensemble d'unités expérimentales est la mesure ultime.
Pour référence, l'article SMOTE: http://www.jair.org/papers/paper953.html