Appliqué Lasso pour classer les fonctionnalités et obtenu les résultats suivants:
rank feature prob.
==================================
1 a 0.1825477951589229
2 b 0.07858498115577893
3 c 0.07041793111843796
Notez que l'ensemble de données a 3 étiquettes. Le classement des fonctionnalités pour les différentes étiquettes est le même.
Ensuite, appliqué une forêt aléatoire au même ensemble de données:
rank feature score
===================================
1 b 0.17504808300002753
6 a 0.05132699243632827
8 c 0.041690685195283385
Notez que le classement est très différent de celui produit par Lasso.
Comment interpréter la différence? Cela implique-t-il que le modèle sous-jacent est intrinsèquement non linéaire?