Disons que j'ai un modèle de classification prédictif basé sur une forêt aléatoire (en utilisant le package randomForest dans R). Je voudrais le configurer pour que les utilisateurs finaux puissent spécifier un élément pour lequel générer une prédiction, et cela produira une probabilité de classification. Jusqu'à présent, aucun problème.
Mais il serait utile / cool de pouvoir sortir quelque chose comme un graphique d'importance variable, mais pour l'élément spécifique prévu, pas pour l'ensemble d'entraînement. Quelque chose comme:
L'article X devrait être un chien (73% de chances)
Parce que:
Jambes = 4
Souffle = mauvaise
fourrure = court
Nourriture = méchant
Tu obtiens le point. Existe-t-il un moyen standard, ou du moins justifiable, d'extraire ces informations d'une forêt aléatoire formée? Si oui, quelqu'un a-t-il du code qui le fera pour le package randomForest?
m
prédicteurs un par un et chercher à voir comment la forêt prédit différemment semble un peu cher. Il doit y avoir un meilleur moyen.