Pour effectuer une analyse en composantes principales (ACP), vous devez soustraire la moyenne de chaque colonne des données, calculer la matrice des coefficients de corrélation, puis trouver les vecteurs propres et les valeurs propres. Eh bien, c'est plutôt ce que j'ai fait pour l'implémenter en Python, sauf qu'il ne fonctionne qu'avec de petites matrices car la méthode pour trouver la matrice de coefficients de corrélation (corrcoef) ne me permet pas d'utiliser un tableau avec une dimensionnalité élevée. Étant donné que je dois l'utiliser pour des images, mon implémentation actuelle ne m'aide pas vraiment.
J'ai lu qu'il est possible de simplement prendre votre matrice de données et de calculer au lieu de , mais cela ne fonctionne pas pour moi. Eh bien, je ne suis pas exactement sûr de comprendre ce que cela signifie, outre le fait qu'il est censé être une matrice au lieu de (dans mon cas ). J'ai lu à propos de ceux dans les tutoriels Eigenfaces mais aucun d'eux ne semblait l'expliquer de telle manière que je pouvais vraiment l'obtenir.D D ⊤ / n D ⊤ D / n n × n p × p p ≫ n
En bref, existe-t-il une description algorithmique simple de cette méthode pour que je puisse la suivre?