Contexte: J'ai demandé à des centaines de participants à mon enquête à quel point ils étaient intéressés par des domaines sélectionnés (par échelles de Likert à cinq points, 1 indiquant «pas intéressé» et 5 indiquant «intéressé»).
Ensuite, j'ai essayé PCA. L'image ci-dessous est une projection des deux premières composantes principales. Les couleurs sont utilisées pour les sexes et les flèches PCA sont des variables originales (c'est-à-dire les intérêts).
J'ai remarqué ça:
- Les points (répondants) sont assez bien séparés par la deuxième composante.
- Il ne reste aucune flèche.
- Certaines flèches sont beaucoup plus courtes que d'autres.
- Les variables tendent à former des grappes, mais pas des observations.
- Il semble que les flèches pointant vers le bas (vers les hommes) sont principalement les intérêts des hommes et les flèches pointant vers le haut sont principalement les intérêts des femmes.
- Certaines flèches ne pointent ni vers le bas ni vers le haut.
Questions: Comment interpréter correctement les relations entre les points (répondants), les couleurs (genres) et les flèches (variables)? Quelles autres conclusions sur les répondants et leurs intérêts peuvent être extraites de ce complot?
Les données peuvent être trouvées ici .