Je lisais le matériel lié à XGBoost. Il semble que cette méthode ne nécessite aucune mise à l'échelle variable car elle est basée sur des arbres et celle-ci peut capturer des interactions complexes de modèle de non-linéarité. Et il peut gérer à la fois des variables numériques et catégorielles et il semble également que les variables redondantes n'affectent pas trop cette méthode.
Habituellement, dans la modélisation prédictive, vous pouvez effectuer une sélection parmi toutes les fonctionnalités dont vous disposez et vous pouvez également créer de nouvelles fonctionnalités à partir de l'ensemble des fonctionnalités dont vous disposez. Donc, sélectionner un sous-ensemble de fonctionnalités signifie que vous pensez qu'il y a une redondance dans votre ensemble de fonctionnalités; créer de nouvelles fonctionnalités à partir du jeu de fonctionnalités actuel signifie que vous effectuez des transformations fonctionnelles sur vos fonctionnalités actuelles. Ensuite, ces deux points devraient être couverts dans XGBoost. Ensuite, cela signifie-t-il que pour utiliser XGBoost, il vous suffit de choisir judicieusement ces paramètres de réglage? Quelle est la valeur de l'ingénierie des fonctionnalités à l'aide de XGBoost?