Actuellement j'utilise RF toolbox sur MATLAB pour un problème de classification binaire
Ensemble de données: 50000 échantillons et plus de 250 fonctionnalités
Alors, quel devrait être le nombre d'arbres et la fonction sélectionnée au hasard sur chaque division pour faire pousser les arbres? tout autre paramètre peut-il affecter considérablement les résultats?