C'est une excellente question, mais malheureusement (ou peut-être heureusement?) Je n'ai écrit que très récemment une très longue réponse dans un fil connexe , répondant à votre question presque exactement. Je vous demanderais de bien vouloir y regarder et voir si cela répond à votre question.
Très brièvement, si nous nous concentrons uniquement sur les chargements PCA et FA W, alors la différence est que PCA trouve W pour reconstruire la matrice de covariance (ou corrélation) de l'échantillon C aussi proche que possible:
C≈WW⊤,
alors que FA trouve
Wpour reconstruire
la partie hors diagonale de la
matrice de covariance (ou corrélation) uniquement:
offdiag{C}≈WW⊤.
J'entends par là que FA ne se soucie pas quelles valeurs
WW⊤ a sur la diagonale, il ne se soucie que de la partie hors diagonale.
Dans cet esprit, la réponse à votre question devient facile à voir. Si le nombren de variables (taille de C) est grande, la partie hors diagonale de C est presque toute la matrice (la diagonale a la taille n et toute la taille de la matrice n2, donc la contribution de la diagonale est seulement 1/n→0), et nous pouvons donc nous attendre à ce que PCA se rapproche bien de FA. Si les valeurs diagonales sont plutôt petites, alors encore une fois, elles ne jouent pas beaucoup de rôle pour PCA, et PCA finit par être proche de FA, exactement comme @ttnphns l'a dit ci-dessus.
Si, en revanche, C est soit petit soit fortement dominé par la diagonale (en particulier s'il a des valeurs très différentes sur la diagonale), alors l'ACP devra biaiser Wvers la reproduction de la diagonale également, et finira donc par être très différent de FA. Un exemple est donné dans ce fil:
p-m
derniers composants principaux - ceux que vous supprimez dans l'ACP (p
c'est le nombre de variables etm
le nombre de composants ou de facteurs que vous avez décidé d'extraire). Si