Supposons que nous ayons un problème de classification binaire avec des fonctionnalités principalement catégorielles. Nous utilisons un modèle non linéaire (par exemple XGBoost ou Random Forests) pour l'apprendre.
- Faut-il encore se préoccuper de la multi-colinéarité? Pourquoi?
- Si la réponse à ce qui précède est vraie, comment la combattre si l'on utilise ces types de modèles non linéaires?