Après avoir fait l'ACP, le premier composant décrit la plus grande partie de la variabilité. Ceci est important, par exemple dans l'étude des mesures corporelles où il est communément connu (Jolliffe, 2002) que l'axe PC1 capture la variation de taille. Ma question est de savoir si les scores PCA après rotation varimax conservent les mêmes propriétés ou sont-ils différents comme mentionné dans cette rubrique ?
Étant donné que j'ai besoin de scores PCA pour d'autres analyses statistiques, je me demande si varimax est nécessaire et perturbe-t-il en fait la représentation de la variabilité réelle de l'échantillon afin que les scores individuels sur des axes tournés ne soient pas informatifs ou conduisent à une mauvaise interprétation de la réalité?
Quelqu'un pourrait-il également suggérer d'autres références sur ce sujet?
Workflows dans R:
- PCA (
FactoMineR
ouprcomp
) -> Extraire les scores individuels -> Entrer les scores dans lelm
- PCA (
FactoMiner
ouprcomp
) -> Varimax sur la matrice de charges -> calculer les scores individuels -> entrer les scores dans lelm
- FA (
psych
, méthode d'extraction varimax et pca) -> extraire les scores individuels -> Entrer les scores dans lelm
Maintenant, sans rotation (1), les pourcentages de variabilité expliquée sont à savoir 29,32, 5,6, 3,2, sur les trois premiers axes. 2. et 3. les solutions donnent des pourcentages similaires sur les trois premiers facteurs, c'est-à-dire 12.2, 12.1, 8.2. Bien sûr, la solution a tendance à pousser toutes les charges variables élevées sur le premier axe, tandis que les solutions 2. et 3. ont tendance à répartir les charges entre les axes (ce qui est la raison de la rotation). Je voulais savoir si ces trois workflows sont essentiels de la même manière car les scores individuels sont différents sur les axes tournés et non tournés?