Modèles de graphiques aléatoires, pour de vrais réseaux informatiques


19

Je m'intéresse aux modèles de graphes aléatoires similaires aux graphes de vrais réseaux informatiques. Je ne sais pas si le modèle commun bien étudié ( n sommets, chaque bord possible est sélectionné avec la probabilité p ) est bon pour étudier les réseaux informatiques réels (est-ce?).G(n,p)np

Quels modèles de graphes aléatoires sont utiles pour comprendre l'évaluation des réseaux informatiques dans la pratique?

Plus généralement, quels autres modèles de graphes aléatoires finis (autres que ceux équivalents au modèle ) ont été étudiés dans la littérature? (Une réponse idéale serait un pointeur vers une enquête pour des modèles étudiés de graphes aléatoires finis.)G(n,p)


2
Où avez-vous besoin de tels modèles - est-ce juste pour générer des entrées de test pour les algorithmes, ou voulez-vous analyser les modèles afin d'apprendre quelque chose sur les réseaux informatiques? Quel type de réseaux informatiques vous intéresse; quelle est votre échelle (LAN vs internet)? Pourquoi supposez-vous que les réseaux informatiques réels sont générés par un processus aléatoire - étonnamment souvent, les réseaux du monde réel sont en fait conçus par un ingénieur, avec assez peu de jetons?
Jukka Suomela

@Jukka, j'essaie de voir si je peux appliquer les techniques développées pour à ces modèles aléatoires pour obtenir des informations sur les réseaux réels, je n'aime pas être plus précis en ce moment car cela pourrait donner loin le problème auquel je pense :). Je m'intéresse principalement à la couche IP d'Internet. J'ai vu des gens utiliser des graphiques aléatoires pour analyser les graphiques issus des réseaux sociaux. Je ne sais pas pourquoi ces vrais réseaux partagent des propriétés avec des graphiques aléatoires, il pourrait y avoir un processus aléatoire caché derrière la surface au travail (cela semble être une question intéressante à poser :). G(n,p)
Kaveh

J'imagine qu'une partie de l'intérêt d'utiliser les modèles aléatoires est qu'il est plus facile de les analyser que d'analyser des réseaux réels, il est donc raisonnable de les considérer s'ils sont assez bons pour une approximation réelle.
Kaveh

Merci à tous pour les bonnes réponses. (Maintenant, je dois passer du temps à lire ces articles. :)
Kaveh

Réponses:


10

Au cours des dernières années, l'étude des graphes aléatoires avec des contraintes structurelles "naturelles" a gagné du terrain. Par exemple, on peut considérer un graphe planaire tiré uar de la classe de tous les graphes planaires à sommets et étudier comment il se comporte comme n . Contrairement aux graphes aléatoires d'Erdős-Rényi ou à d'autres modèles similaires, les bords de ces graphiques sont fortement dépendants, de sorte qu'une des pseudo-motivations pour étudier de telles distributions est d'analyser les modèles de réseau avec une indépendance très limitée entre les bords.nn

Cependant, à l'heure actuelle, cet objectif semble assez éloigné car l'indépendance limitée rend beaucoup plus difficile l'analyse des propriétés de ces graphiques. En fait, plusieurs questions de base auxquelles il est très facile de répondre pour , comme la distribution de la séquence de degrés, n'ont été résolues que très récemment pour les graphiques planaires aléatoires.G(n,p)

Pour une référence définitive, voir les articles de Konstantinos Panagiotou et les citations qu'ils contiennent. Pour plus de commodité, voici un petit échantillon de quelques articles pertinents:

  • Sur la distribution des degrés des graphes planaires aléatoires . Konstantinos Panagiotou et Angelika Steger . À paraître dans les Actes du 22e Symposium annuel ACM-SIAM sur les algorithmes discrets (SODA '11).
  • Sur les propriétés des dissections et triangulations aléatoires . Nicla Bernasconi, Konstantinos Panagiotou et Angelika Steger . Dans les actes du 19e Symposium annuel ACM-SIAM sur les algorithmes discrets (SODA '08), p. 132-141. [http://www.mpi-inf.mpg.de/~kpanagio/Dissections.pdf]
  • Sur les séquences de degrés des graphes externes planaires et parallèles en série . Nicla Bernasconi, Konstantinos Panagiotou et Angelika Steger . Dans les Actes du 12ème Atelier International sur les Techniques Aléatoires en Calcul (RANDOM'08), p. 303-316. [http://www.mpi-inf.mpg.de/~kpanagio/OPSP.pdf]

1
Un commentaire supplémentaire: cette ligne de recherche remonte en fait à quelque 15 ans, au moins à un article de Denise, Vasconcellos et Welsh (1996), et l'une des raisons pour lesquelles elle a "gagné du terrain" maintenant est le grand succès de l'application de la combinatoire analytique et le dénombrement asymptotique ici, par exemple par Gimenez et Noy (2009).
RJK

10

Cette enquête, La structure et la fonction des réseaux complexes par Newman, passe en revue les techniques et les modèles de réseaux complexes réels, y compris des concepts tels que l'effet du petit monde, la distribution des degrés et les modèles de graphes aléatoires. En outre, le même auteur a un bon article, Graphes aléatoires comme modèles de réseaux , sur les adaptations de graphiques aléatoires pour modéliser des réseaux réels.

Les références:

1) Graphes aléatoires comme modèles de réseaux, MEJ Newman, dans Handbook of Graphs and Networks, S. Bornholdt et HG Schuster (éd.), Wiley-VCH, Berlin (2003)

2) La structure et la fonction des réseaux complexes, MEJ Newman, SIAM Review 45, 167-256 (2003)


1
juste curieux: est-ce pour les réseaux "sociaux" vs internet?
Suresh Venkat

J'appuie ceci: les approches des réseaux sociaux devraient être très utiles, étant donné qu'une grande partie de l'étude de ces réseaux était initialement axée sur les propriétés "universelles" des réseaux, et comprenait la topologie neuronale, le réseau électrique et les réseaux routiers. De plus, les filets Barabasi-Albert et Watts-Strogatz, chacun avec des propriétés que les réseaux réels ont et Erdos-renyi néglige, sont très très très bien étudiés
Elliot JJ

1
@Suresh, ces réseaux complexes couverts dans les deux références incluent les réseaux informatiques tels que l'Internet et les réseaux sociaux.
Mohammad Al-Turkistany

8

De vrais réseaux informatiques à quelle couche? Internet est, au niveau de l'AS (sans doute le niveau le plus élevé), un petit réseau mondial avec des nœuds extrêmement élevés. Au fur et à mesure que les couches se rapprochent des fils réels, le graphique devient plus lié à la géographie et moins lié à la couche sociale (social n'est pas le bon mot - est-ce vraiment un réseau social lorsque les entités "amis" sont des sociétés multinationales?) . Dans le cas extrême, un Ethernet local est un arbre logique qui est (probablement) un sous-graphique du modèle physique des connexions de fils, et ce modèle de connexions de fils n'est probablement pas trop de fils de plus qu'un arbre.

Les "vrais réseaux informatiques" se déclinent en plusieurs variantes et couches. Certains d'entre eux ressemblent à des réseaux sociaux, d'autres non. Pour en savoir plus à ce sujet, je vous renvoie impudiquement au chapitre 2 de ma thèse - http://home.manhattan.edu/~peter.boothe/thesis.pdf


Je m'intéresse principalement aux réseaux physiques (disons la couche IP). Merci pour le lien, je vais le vérifier.
Kaveh

2
La couche IP n'est pas la couche physique. MPLS et d'autres technologies de commutation de circuits brisent cette hypothèse. La couche physique est constituée des fils. Nous avons même des liaisons multifilaires qui semblent être des sauts Ethernet simples! Cette question de "quelle couche" est plus profonde que la première inspection pourrait suggérer, et nécessite une réflexion approfondie. Je vous suggère de penser aux propriétés que vous pourriez souhaiter qu'un réseau possède, de trouver la couche où l'analyse de la topologie vous aidera le mieux à analyser cette propriété et d'espérer que les données sont disponibles.
Peter Boothe


5

Walter Willinger a bâti sa carrière sur l'utilisation de graphiques sans échelle pour modéliser des réseaux. Il y a trop de choses à citer, je vais donc vous signaler son entrée DBLP . Le point clé de ces modèles est qu'ils ont des propriétés similaires aux réseaux "réels" qui ne sont pas capturés par G (n, p).



5

Au lieu de trouver, justifier et analyser laborieusement un modèle spécifique, vous voudrez peut-être utiliser les données réelles dont vous disposez (si vous en avez). Cela signifie définir un modèle probabiliste générique et entraîner ses paramètres en fonction de vos données (par exemple par estimation de vraisemblance maximale).

Sp1:(S)Sp2:εp1,p2

De toute évidence, la grammaire spécifique peut (et devrait!) Utiliser la connaissance du domaine. Considérons par exemple différentes grammaires utilisées pour la prédiction de la structure secondaire de l'ARN dans Dowell, Eddy (2004) pour un avant-goût.

Trouvez quelques détails sur cette technique dans Weinberg, Nebel (2010) . Je ne sais pas comment (bien) cela peut être appliqué aux graphiques généraux, cependant.

Si vous avez besoin de plus de puissance, vous pouvez passer à des trucs comme le CFG multidimensionnel (S) (par exemple Seki, Kato (2008) ) ou le SCFG dépendant de la longueur / position ( Weinberg, Nebel (2010) ).


1
c'est cool, mais la nature sans contexte de SCFG n'oblige-t-il pas votre apprenant à négliger une certaine structure globale que pourraient avoir les réseaux de votre formation?
Artem Kaznatcheev

Eh bien, oui, les fonctionnalités non contextuelles se perdent. Mais notez que des propriétés comme les degrés de nœuds (moyens) peuvent être capturées. Pour en savoir plus, consultez ma modification.
Raphael

Merci! Je vais regarder de plus près. Les MDP cachés ne peuvent-ils pas également capturer des propriétés telles que le degré moyen? Cela semble être quelque chose qu'une langue ordinaire devrait pouvoir capturer, ou suis-je confus? (En outre, point mineur: le lien Weinberg, Nebel a un caractère de fin qui tue le lien, il est évident quel lien vous vouliez, mais si vous apportez plus de modifications, cela pourrait valoir la peine d'être corrigé).
Artem Kaznatcheev

Bien sûr, je voulais juste souligner que vous pouvez couvrir certaines caractéristiques globales en utilisant ce modèle. REG peut également couvrir certaines d'entre elles, mais ne parviendra pas à modéliser des structures intrinsèquement non régulières. (merci, fixe)
Raphael

3

g(n,p)g(n,m) Emergence of Scaling in Random Networks par exemple.

Comme vous le savez probablement, il semble y avoir une différence entre le graphique de connectivité pour le World Wide Web et opposé au graphique de connectivité pour l'infrastructure Internet. Je ne prétends certainement pas être un expert, mais j'ai vu l'article de Li, Alderson, Tanaka, Doyle et Willinger «Vers une théorie des graphiques sans échelle: définition, propriétés et implications» qui présente une «s-métrique» "pour mesurer la" non-échelle "d'un graphique (avec la définition de graphiques sans échelle encore en débat pour autant que je sache) qui prétendent avoir un modèle graphique qui crée des graphiques qui sont similaires à la connectivité Internet au niveau d'un routeur niveau.

Voici quelques modèles plus génératifs qui pourraient être intéressants:

L'article de Berger, Borgs, Chayes, D'Souza et Kleinberg "Attachement préférentiel induit par la concurrence"

Tolérance hautement optimisée de Carlson et Doyle : un mécanisme pour les lois de puissance dans les systèmes conçus

Un point critique de Molloy et Reed pour les graphiques aléatoires avec une séquence de degrés donnée qui présente le "modèle de configuration effacé"

Newman's Clustering et attachement préférentiel dans les réseaux en croissance (ce qui a déjà été mentionné)

On pourrait également générer explicitement une distribution des degrés et créer un graphique de cette façon, mais je ne sais pas à quel point cela modélise le graphique Internet au niveau du routeur.

Il y a, bien sûr, beaucoup plus de littérature sur le sujet et je n'ai donné que quelques-uns (ce que je considère comme) des faits saillants.

g(n,p)g(n,m)) ne fonctionnent pas précisément parce que les graphiques aléatoires sans échelle ou de loi de puissance distribués divergent le deuxième moment de la distribution des degrés. Je ne prétends pas en savoir assez sur le sujet pour faire des affirmations catégoriques sur "la plupart" des preuves, mais d'après ce que j'ai vu, l'une des premières lignes de preuves des propriétés sur les graphes aléatoires Erdos-Renyi suppose explicitement un fini deuxième moment dans la distribution des diplômes. De mon point de vue, cela a du sens, car un second moment fini rend les graphiques d'Erdos-Renyi beaucoup plus locaux comme des arbres (voir Mertens et Montanari's informations, la physique et le calcul de), ce qui confère effectivement l'indépendance aux propriétés / chemins / structures Étant donné que les graphes aléatoires distribués en degrés de loi de puissance ont un deuxième moment divergeant, cette structure arborescente locale est détruite (et nécessite donc différentes techniques de preuve?). Je serais heureux de voir cette intuition invalidée si quelqu'un avec plus de connaissances ou de perspicacité montrait pourquoi il n'en était pas ainsi.

J'espère que cela pourra aider.


3

Bien que ce soit un vieux sujet auquel je réponds car il y a beaucoup de gens qui visitent encore de tels messages. Je suis motivé par un commentaire dans une autre réponse.

Le modèle de Barabasi-Albert et d'autres modèles qui produisent des graphiques sans échelle ont été proposés pour modéliser Internet au niveau du routeur et au niveau du système autonome. Bien qu'au départ de tels modèles aient été jugés exacts, il s'est avéré que nous n'avons pas une image complète de la topologie Internet en raison de difficultés à découvrir tous les liens. Bien que l'on pense qu'il s'agit d'une queue lourde, il s'agit pratiquement d'un travail en cours.

Pour votre référence, vous pouvez lire: RG Clegg, C Di Cairano-Gilfedder, S Zhou, Un regard critique sur la modélisation de la loi de puissance de l'Internet


2

Il y a plusieurs ouvrages sur les graphes aléatoires, comme livre de Bollobás et il existe plusieurs modèles de graphes aléatoires comme petit monde lien de wikipedia ou attachement préférentiel lien pour wikipedia , aux réseaux de modèles avec de petites distances entre les ordinateurs ou ceux avec une distribution degré suivant une loi de puissance , respectivement.

Je pense qu'il n'y a pas de moyen facile de modéliser un vrai réseau informatique, mais je suis assez sûr que G (n, p) ne le modéliserait pas très bien. Sauf si vous travaillez avec un réseau organisé très spécifique.


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.