Je voudrais savoir s'il y a des avantages / certains à utiliser l'échantillonnage stratifié au lieu de l'échantillonnage aléatoire, lors de la division de l'ensemble de données d'origine en ensemble de formation et de test pour la classification.
De plus, l'échantillonnage stratifié introduit-il plus de biais dans le classificateur que l'échantillonnage aléatoire?
[1] Chawla, Nitesh V. et al. " SMOTE: technique de sur-échantillonnage des minorités synthétiques. " Journal of Artificial Intelligence Research 16 (2002): 321-357.