J'essaie de comprendre l'utilisation de l'ACP dans un récent article de journal intitulé «Cartographie de l'activité cérébrale à l'échelle avec l'informatique en grappes» Freeman et al., 2014 (pdf gratuit disponible sur le site Web du laboratoire ). Ils utilisent l'ACP sur les données de séries chronologiques et utilisent les poids de l'ACP pour créer une carte du cerveau.
Les données sont des données d'imagerie essai à la moyenne, stockées en tant que matrice (appelée Y dans le papier) avec n voxels (ou des emplacements de formation d'image dans le cerveau) × T points de temps (la longueur d'une seule stimulation au cerveau).
Ils utilisent la SVD résultant en Y = U S V ⊤ ( V ⊤ indiquant la transposition de la matrice V ).
Les auteurs déclarent que
Les composantes principales (les colonnes de ) sont des vecteurs de longueur t , et les scores (les colonnes de U ) sont des vecteurs de longueur n (nombre de voxels), décrivant la projection de chaque voxel sur la direction donnée par la composante correspondante , formant des projections sur le volume, c'est-à-dire des cartes du cerveau entier.
Ainsi , les PC sont des vecteurs de longueur t . Comment puis-je interpréter que la "première composante principale explique le plus de variance" comme cela est communément exprimé dans les didacticiels de l'ACP? Nous avons commencé avec une matrice de nombreuses séries chronologiques hautement corrélées - comment une seule série temporelle PC explique-t-elle la variance dans la matrice d'origine? Je comprends toute la chose "rotation d'un nuage gaussien de points vers l'axe le plus varié", mais je ne sais pas comment cela se rapporte aux séries chronologiques. Qu'entendent les auteurs par direction lorsqu'ils déclarent: "les scores (les colonnes de U ) sont des vecteurs de longueur n (nombre de voxels), décrivant la projection de chaque voxel sur la direction donnée par la composante correspondante "? Comment une évolution temporelle d'une composante principale peut-elle avoir une direction?
Pour voir un exemple de la série chronologique résultante de combinaisons linéaires des principaux composants 1 et 2 et de la carte cérébrale associée, accédez au lien suivant et passez la souris sur les points du tracé XY.
Ma deuxième question est liée aux trajectoires (état-espace) qu'ils créent en utilisant les scores des composantes principales.
Ceux-ci sont créés en prenant les 2 premiers scores (dans le cas de l'exemple "optomoteur" que j'ai décrit ci-dessus) et en projetant les essais individuels (utilisés pour créer la matrice moyenne des essais décrite ci-dessus) dans le sous-espace principal par l'équation:
Comme vous pouvez le voir sur les films liés, chaque trace dans l'espace d'état représente l'activité du cerveau dans son ensemble.
Quelqu'un peut-il fournir l'intuition de ce que signifie chaque "image" du film de l'espace d'état, par rapport au chiffre qui associe l'intrigue XY des scores des 2 premiers PC. Qu'est-ce que cela signifie à un "cadre" donné pour qu'un essai de l'expérience soit dans une position dans l'espace d'état XY et qu'un autre essai soit dans une autre position? Comment les positions de l'intrigue XY dans les films sont-elles liées aux principales traces de composants dans la figure liée mentionnée dans la première partie de ma question?