Récemment, j'ai appris que la création de fonctionnalités est l'un des moyens de trouver de meilleures solutions aux problèmes de ML. On peut le faire en additionnant par exemple deux fonctionnalités.
Par exemple, nous possédons deux fonctionnalités "attaque" et "défense" d'une sorte de héros. Nous créons ensuite une fonctionnalité supplémentaire appelée «total» qui est une somme «d'attaque» et de «défense». Maintenant, ce qui me semble étrange, c'est que même une «attaque» et une «défense» difficiles sont presque parfaitement corrélées avec le «total», nous obtenons toujours des informations utiles.
Quel est le calcul derrière cela? Ou est-ce que je raisonne mal?
De plus, n'est-ce pas un problème, pour des classificateurs tels que kNN, que le "total" sera toujours plus grand que "l'attaque" ou la "défense"? Ainsi, même après la normalisation, nous aurons des fonctionnalités contenant des valeurs de différentes plages?