L'algorithme PCA peut être formulé en termes de matrice de corrélation (supposons que les données ont déjà été normalisées et que nous ne considérons que la projection sur le premier PC). La fonction objectif peut s'écrire:
C'est très bien, et nous utilisons des multiplicateurs lagrangiens pour le résoudre, c'est-à-dire le réécrire comme:
ce qui équivaut à
et donc ( voir ici sur Mathworld ) semble être égal à
Mais cela dit de maximiser la distance entre le point et la ligne, et d'après ce que j'ai lu ici , c'est incorrect - ce devrait être , pas . Où est mon erreur?
Ou, quelqu'un peut-il me montrer le lien entre maximiser la variance dans l'espace projeté et minimiser la distance entre le point et la ligne?