Je souhaite réduire la dimensionnalité des systèmes d'ordre supérieur et capturer l'essentiel de la covariance sur un champ de préférence à 2 dimensions ou à 1 dimension. Je comprends que cela peut être fait via l’analyse en composantes principales et j’ai utilisé PCA dans de nombreux scénarios. Cependant, je ne l'ai jamais utilisé avec des types de données booléens et je me demandais s'il était utile de réaliser une analyse PCA avec cet ensemble. Ainsi, par exemple, supposez que j'ai des métriques qualitatives ou descriptives, et j'attribue un "1" si cette métrique est valide pour cette dimension, et un "0" si ce n'est pas le cas (données binaires). Ainsi, par exemple, supposez que vous essayez de comparer les Sept Nains dans Blanche-Neige. On a:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy et Happy, et vous voulez les arranger en fonction de vos qualités et vous l'avez fait tel quel:
Ainsi, par exemple, Bashful est intolérant au lactose et non inscrit au tableau d'honneur A. Ceci est une matrice purement hypothétique, et ma vraie matrice aura beaucoup plus de colonnes descriptives. Ma question est la suivante: serait-il toujours approprié d’utiliser PCA sur cette matrice pour trouver la similitude entre les individus?
a means of finding the similarity between individuals
. Mais cette tâche est destinée à une analyse de cluster, pas à la PCA.