Quelle est la différence entre le regroupement de graphes et les méthodes de détection communautaire?


9

Fondamentalement, l'objectif des méthodes de clustering de graphes et de détection de communauté est de calculer les clusters. Y a-t-il une différence entre eux?

Réponses:


7

Non. Citant par exemple la détection communautaire dans les graphiques , une récente et très bonne enquête de Santo Fortunato, "Cette caractéristique des réseaux réels est appelée structure communautaire (Girvan et Newman, 2002), ou clustering". Il ne sert à rien de développer davantage ce point, vraiment. J'ai le sentiment que dans les premiers articles sur le style d'analyse des réseaux sociaux, les réseaux avaient tendance à être simples (non pondérés), mais ce n'est pas quelque chose que je voudrais argumenter, ni important. La réponse à votre question est non.


0

Dans Detecting Community Structures in Networks , M.Newman définit le clustering de graphes comme un problème spécifique défini dans le contexte de l'informatique.

Prenons un calcul, qui peut être divisé en plusieurs opérations plus simples. Ceux-ci sont représentés comme des nœuds dans notre réseau. Les liens correspondent aux dépendances entre les opérations, c'est-à-dire que le résultat d'une opération est nécessaire à une autre. Le problème consiste à répartir les opérations sur plusieurs processeurs, à des fins de traitement parallèle. En d'autres termes, nous voulons affecter chaque nœud (opération) à une classe spécifique (processeur), c'est-à-dire que nous voulons partitionner le graphe.

Il existe cependant trois contraintes. La première consiste à obtenir un nombre prédéfini de communautés, car le nombre de processeurs est évidemment connu à l'avance. La seconde consiste à obtenir une charge équilibrée: nous voulons que chaque processeur effectue à peu près le même nombre d'opérations. En termes de graphique, nous voulons que les communautés contiennent approximativement le même nombre de nœuds. La troisième consiste à obtenir la communication la plus faible possible entre les processeurs, car elle ralentit le processus. Donc, en termes de graphique, nous voulons minimiser le nombre de liens entre les communautés.

Ainsi, de ce point de vue, la détection de communauté peut être considérée comme un problème plus général que le clustering de graphes. La troisième contrainte est imposée dans les deux problèmes, mais le nombre et la taille des communautés ne sont pas connus a priori dans la détection des communautés.


4
Cette réponse est trompeuse. Lorsque le nombre et la taille des clusters sont connus a priori, le problème est connu sous le nom de partitionnement de graphiques , et non de clustering de graphiques. La page wiki n'est pas géniale, mais un début: en.wikipedia.org/wiki/Graph_partition .
micans

mon mauvais, je pensais que les deux tâches étaient similaires. Leurs différences sont mises en évidence ici: cc.gatech.edu/dimacs10
Vincent Labatut

0

Ces deux noms différents sont attribués à la même chose par différentes communautés de scientifiques, selon que l'on souhaite ou non mettre l'accent sur la motivation des réseaux sociaux. Peut-être que quelqu'un définit le clustering et la détection de communauté comme des choses différentes, mais la plupart des gens qui étudient l'un d'entre eux ne pourraient pas vous dire pourquoi ils n'utilisent pas l'autre terme.


0

Si un grand réseau est divisé en deux parties, qu'est-ce qui vous garantit que ces deux parties sont deux communautés? Deux clusters ont une connexion faible ne signifie pas que chaque cluster a un type de nœuds similaire ou des nœuds ont un type de connexions similaire (donc une communauté). Pensez au graphique des réseaux sociaux. Il y a sûrement beaucoup de communautés. De plus, en regroupant les algorithmes, vous pouvez le regrouper en deux parties. Dans ce cas, qualifieriez-vous chaque pièce de communauté. ? Ma réponse est non. Parce que, les deux grappes peuvent être des personnes de deux régions géographiques. Et puis ce ne sont sûrement pas des communautés.

Les algorithmes de clustering se soucient uniquement de la coupe minimale, pas de la similitude des nœuds ou de la similitude de connexion ou de la connexion dense. De plus, dans les algorithmes de clustering, le nombre de clusters doit être prédéfini.

Les algorithmes de détection des communautés, ils se soucient de la densité, ils trouvent la partie la plus dense du réseau et ce type d'algorithmes (je l'ai vu jusqu'à présent) n'a pas besoin de prédéfinir le nombre de communautés.

Cependant, l'algorithme de clustering peut être utilisé pour trouver des communautés, puis, comme il ne garantit pas que chaque cluster possède une bonne structure communautaire, chaque cluster doit être soigneusement examiné.


0

"on ne peut pas appliquer trivialement la découverte de communauté pour résoudre le clustering et vice versa. malgré leurs similitudes, il existe des différences importantes dans les approches. La découverte de communauté suppose des connexions clairsemées, tandis que le clustering peut fonctionner avec des ensembles de données denses; dans le clustering, nous traitons généralement des attributs avec plusieurs types , alors que la découverte de communauté traite généralement d'un seul type d'attribut - les bords - souvent binaires, dans le cas des réseaux non pondérés "pour plus d'informations, lisez l'article suivant:" Sur l'équivalence entre la découverte de la communauté et le clustering "par Riccardo Guidotti et Michele Coscia

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.