Je lis cet article sur la différence entre l'analyse en composantes principales et l'analyse discriminante multiple (analyse discriminante linéaire), et j'essaie de comprendre pourquoi vous utiliseriez jamais PCA plutôt que MDA / LDA.
L'explication est résumée comme suit:
En gros, dans PCA, nous essayons de trouver les axes avec les variances maximales où les données sont les plus réparties (au sein d'une classe, car PCA traite l'ensemble de données comme une seule classe), et dans MDA, nous maximisons en outre la répartition entre les classes.
Ne voudriez-vous pas toujours à la fois maximiser la variance et maximiser la répartition entre les classes?