Si je comprends bien, une analyse discriminante linéaire (LDA) suppose des données distribuées normales, des caractéristiques indépendantes et des covariances identiques pour chaque classe pour le critère d'optimalité.
Puisque la moyenne et la variance sont estimées à partir des données d'entraînement, n'est-ce pas déjà une violation?
J'ai trouvé une citation dans un article (Li, Tao, Shenghuo Zhu et Mitsunori Ogihara. « Using Discriminant Analysis for Multi-Class Classification: An Experimental Investigation ». Knowledge and Information Systems 10, no. 4 (2006): 453–72 .)
"L'analyse discriminante linéaire obtient fréquemment de bonnes performances dans les tâches de reconnaissance du visage et des objets, même si les hypothèses de matrice de covariance commune entre les groupes et de normalité sont souvent violées (Duda, et al., 2001)"
- malheureusement, je n'ai pas trouvé la section correspondante dans Duda et. Al. "Classification des motifs".
Avez-vous des expériences ou des réflexions sur l'utilisation de la LDA (par rapport à la LDA régularisée ou à la QDA) pour des données non normales dans un contexte de réduction de dimensionnalité?