J'ai joué avec des forêts aléatoires pour la régression et j'ai du mal à comprendre exactement ce que signifient les deux mesures d'importance et comment elles doivent être interprétées.
La importance()
fonction donne deux valeurs pour chaque variable: %IncMSE
et IncNodePurity
. Existe-t-il des interprétations simples pour ces 2 valeurs?
En IncNodePurity
particulier, s’agit-il simplement du montant que le RSS augmente suite à la suppression de cette variable?
?importance
? Il y a une explication sur ce que les deux mesures signifient ...