La meilleure façon de regrouper une matrice d'adjacence


9

J'ai eu du mal à interpréter les grappes résultantes d'une matrice d'adjacence. J'ai 200 matrices relativement grandes représentant des sujets qui contiennent des corrélations partielles (scores z) de séries chronologiques (données neuronales). L'objectif est de regrouper ces 210 matrices et de détecter toute communauté potentielle non découverte. J'ai donc fait un autre calcul de corrélation partielle résultant en une matrice d'adjacence 200x200. Chaque fois que je lance un algorithme de détection de communauté (par exemple Newmann), il arrive avec des communautés difficilement interprétables.

La question est de savoir quel genre de tests statistiques qui diront si ces communautés ou grappes sont significatives? et dans l'affirmative, existe-t-il des moyens systématiques d'élaborer l'interprétation?


Pour autant que je sache, il n'y a pas de «bonne façon» unique de procéder. Une approche consisterait à utiliser quelque chose comme un regroupement hiérarchique sur la matrice de distanceoù est les corrélations. L'autre chose est de savoir si votre dernière matrice de corrélation capturera des relations significatives. Quelles mesures ont été prises pour le produire? 1-|ρ|ρ
conjectures

Merci. Concernant votre question, ce que j'ai fait, c'est que j'ai corrélé chaque ligne (ou les données des sujets) avec tous les autres sujets en utilisant corrcoef (simple corrélation) et c'est ainsi que j'ai obtenu les résultats. J'essaie de détecter les motifs et c'est pourquoi j'ai dû corréler à nouveau.
Fahd

dans le PO, il est suggéré que les données des sujets soient évaluées de manière matricielle, alors comment cela devient-il une seule ligne par sujet?
conjectures

Réponses:


2

J'ai déjà travaillé dans le passé sur le regroupement spectral qui pourrait être utile ici. L'idée de base est que l'on peut utiliser la matrice d'adjacence pour former ce que l'on appelle la matrice laplacienne:

L=je--1/2UNE-1/2

Vous pouvez vérifier par vous-même que la valeur propre la plus basse du laplacien est zéro. La première valeur propre non nulle est souvent appelée connectivité algébrique, et le vecteur eigne correspondant aura une partie positive et une partie négative correspondant à deux partitions(B1,B2)du graphique sous-jacent. En gros, la grandeur de la première valeur eigne non nulle est une mesure de la force des connexions entre les deux partitions. Vous pourriez peut-être utiliser cette approche de manière récursive ou considérer les premières valeurs propres non nulles du laplacien. L' article suivant de Wikipédia sur le regroupement spectral est un bon début.


2

Je regarde le même problème en ce moment. D'un examen rapide, il semble que le clustering spectral soit la façon la plus "naturelle" d'analyser une matrice d'adjacence. Voir cet article de blog pour plus de détails.


0

Alternativement ... Les données neuronales (réelles ou artificielles) sont souvent une représentation très compressée des données, ce qui signifie que les données sont très aléatoires, ce qui signifie que vous ne trouverez aucune corrélation. Que vous avez !! Toutes nos félicitations! :)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.