Les forêts de décision et les forêts aléatoires sont-elles la même chose?


8

Sur la base d'une réponse sur la validation croisée, j'ai cherché à implémenter une forêt aléatoire en .NET / C # pour classer les documents de texte.

En parcourant le Web pour voir s'il existe des implémentations existantes, je suis tombé sur un algorithme pour une forêt de décision sur Alglib .

Le truc c'est que je n'arrive pas à trouver quelque chose de spécifique à la "forêt de décision" n'importe où (c'est ambigu même ici ), c'est typiquement mélangé avec une forêt aléatoire.

Cela dit, les deux sont-ils identiques, simplement référencés différemment, ou y a-t-il des différences inhérentes entre les deux?

Réponses:


13

Sur la page d'Alglib que vous avez citée, il est écrit:

"L'algorithme RDF [Random decision forest] est une modification de l'algorithme original Random Forest conçu par Leo Breiman et Adele Cutler."

Une question sur rapid-i.com fait référence à

Ho TK (1998) The Random Subspace Method for Constructing Decision Forests. IEEE Trans Pattern Anal Mach Intel 20 (8) 832-844 [ Résumé ]

ce qui pourrait être encore une autre chose.

Sur la page Web de Breiman à Berkeley , il est écrit:

"Random Forests (tm) est une marque déposée de Leo Breiman et Adele Cutler et est concédée sous licence exclusive à Salford Systems pour la sortie commerciale du logiciel. Nos marques incluent également RF (tm), RandomForests (tm), RandomForest (tm) et Random Forêt (tm). "

Je conclus donc qu'il existe de subtiles différences, mais c'est surtout un problème de marque concernant le nom de "forêt aléatoire".

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.