Je pense que ce sont 2 choses différentes,
Commençons par la sélection des fonctionnalités :
Cette technique est utilisée pour sélectionner les caractéristiques qui expliquent le plus la variable cible (a une corrélation avec la variable cible). Ce test est exécuté juste avant l'application du modèle sur les données.
Pour mieux l'expliquer, prenons un exemple: il y a 10 caractéristique et 1 variable cible, 9 caractéristiques expliquent 90% de la variable cible et 10 caractéristiques ensemble 91% de la variable cible. La variable 1 ne fait donc pas beaucoup de différence, vous avez donc tendance à supprimer cela avant la modélisation (elle est également subjective pour l'entreprise). Je peux également être appelé comme Predictor Importance.
Parlons maintenant de l' extraction de fonctionnalités ,
Qui est utilisé dans l'apprentissage non supervisé, extraction des contours dans les images, extraction des Biogrammes d'un texte, extraction des phonèmes de l'enregistrement du texte parlé. Lorsque vous ne savez rien sur les données comme aucun dictionnaire de données, trop de fonctionnalités, ce qui signifie que les données ne sont pas dans un format compréhensible. Ensuite, vous essayez d'appliquer cette technique pour obtenir certaines fonctionnalités qui expliquent la plupart des données. L'extraction d'entités implique une transformation des entités, qui souvent n'est pas réversible car certaines informations sont perdues dans le processus de réduction de dimensionnalité.
Vous pouvez appliquer l'extraction d'entités sur les données données pour extraire des entités, puis appliquer la sélection d'entités par rapport à la variable cible pour sélectionner le sous-ensemble qui peut aider à créer un bon modèle avec de bons résultats.
vous pouvez passer par ces Link-1 , Link-2 pour une meilleure compréhension.
nous pouvons les implémenter en R, Python, SPSS.
faites-moi savoir si vous avez besoin de plus de précisions.