Réponse courte
Les CART ont besoin d'aide pour capturer les interactions.
Longue réponse
Prenez l'algorithme gourmand exact (Chen et Guestrin, 2016):
La moyenne sur la feuille sera une attente conditionnelle, mais chaque division sur le chemin de la feuille est indépendante de l'autre. Si la fonctionnalité A n'a pas d'importance en elle-même mais qu'elle importe en interaction avec la fonctionnalité B, l'algorithme ne se divisera pas sur la fonctionnalité A. Sans cette division, l'algorithme ne peut pas prévoir la division sur la fonctionnalité B, nécessaire pour générer l'interaction.
Les arbres peuvent choisir des interactions dans les scénarios les plus simples. Si vous avez un jeu de données avec deux entités et la cible , l'algorithme n'a rien à partager, sauf et , par conséquent, vous obtiendrez quatre feuilles avec estimé correctement.x1,x2y=XOR(x1,x2)x1x2XOR
Avec de nombreuses fonctionnalités, la régularisation et la limite stricte du nombre de divisions, le même algorithme peut omettre les interactions.
Solutions de contournement
Interactions explicites en tant que nouvelles fonctionnalités
Un exemple de Zhang («Winning Data Science Competitions», 2015):
Algorithmes d'arbre non gourmands
Dans l'autre question, Simone suggère des algorithmes basés sur l'anticipation et des arbres de décision obliques .
Une approche d'apprentissage différente
Certaines méthodes d'apprentissage gèrent mieux les interactions.
Voici un tableau de The Elements of Statistical Learning (ligne "Capacité à extraire des combinaisons linéaires de caractéristiques"):