J'ai un classificateur sur lequel je fais une validation croisée, ainsi qu'une centaine de fonctionnalités sur lesquelles je fais une sélection avant pour trouver des combinaisons optimales de fonctionnalités. Je compare également cela à l'exécution des mêmes expériences avec PCA, où je prends les fonctionnalités potentielles, applique SVD, transforme les signaux d'origine sur le nouvel espace de coordonnées et utilise les meilleures fonctionnalités dans mon processus de sélection avant.
Mon intuition était que PCA améliorerait les résultats, car les signaux seraient plus "informatifs" que les caractéristiques originales. Ma compréhension naïve de l'APC me conduit-elle dans des ennuis? Quelqu'un peut-il suggérer certaines des raisons courantes pour lesquelles l'APC peut améliorer les résultats dans certaines situations, mais les aggraver dans d'autres?