Quelqu'un peut-il expliquer la différence entre RandomForestClassifier et ExtraTreesClassifier dans scikit learn. J'ai passé un bon moment à lire l'article:
P. Geurts, D. Ernst., Et L. Wehenkel, «Arbres extrêmement aléatoires», Machine Learning, 63 (1), 3-42, 2006
Il semble que ce soit la différence pour ET:
1) Lors du choix des variables lors d'un fractionnement, les échantillons sont tirés de l'ensemble d'apprentissage entier au lieu d'un échantillon bootstrap de l'ensemble d'apprentissage.
2) Les divisions sont choisies complètement au hasard dans la plage de valeurs de l'échantillon à chaque division.
Le résultat de ces deux choses est beaucoup plus de «feuilles».