Marche aléatoire et temps de frappe moyen dans un graphique simple non orienté


10

Soit un simple graphe non orienté sur sommets et m arêtes.n mg=(V,E)nm

Je suis en train de déterminer la durée prévue de l'algorithme de Wilson pour générer un arbre couvrant aléatoire de g . Là, il apparaît O(τ) , où τ est le temps moyen de frappe :

τ=vVπ(v)H(u,v),
où:
  • π est la distribution stationnaire π(v)=(v)2m ,
  • u est un sommet arbitraire, et
  • H(u,v) est le temps de frappe ( temps d' accès AKA ), c'est-à-dire le nombre prévu d'étapes avant que le sommet v soit visité, à partir du sommet u .

Quelle est la limite supérieure générale du temps de frappe moyen? Et quel est le pire cas g qui maximise le temps de frappe moyen?


Pour clarifier ma question, je n'ai pas besoin de calculs ou d'une preuve détaillée (bien qu'ils puissent être utiles à d'autres personnes rencontrant cette question à l'avenir). Pour moi personnellement, une citation serait suffisante.

L'article mentionne un autre algorithme de Broder qui fonctionne dans le temps de couverture prévu (première fois lorsque tous les sommets ont été visités). Ensuite, il est dit que le temps moyen de frappe est toujours inférieur au temps de couverture. Cependant, il ne donne qu'une limite asymptotique de Θ(n) pour la plupart des graphiques (c'est -dire des graphiques expanseurs ) pour le comparer avec Θ(nJournaln) par Broder pour la plupart des graphiques (avec une définition un peu plus inclusive de la plupart ).

Il donne un exemple de graphique où le temps de frappe moyen est et le temps de couverture est . Bien que l'on sache que c'est le pire des cas pour ce dernier, il ne dit rien du tout sur le pire des cas. Cela signifierait que le pire des cas pour l'algorithme de Wilson pourrait se situer n'importe où entre et .Θ ( n 3 ) O ( n 2 ) O ( n 3 )Θ(n2)Θ(n3)O(n2)O(n3)

Il y a deux implémentations publiquement disponibles de l'algorithme de Wilson que je connais. L'un est dans la bibliothèque de graphiques Boost , tandis que le second est dans l' outil graphique . La documentation du premier ne mentionne pas le temps de fonctionnement, tandis que le second déclare:

Le temps d'exécution typique pour les graphiques aléatoires est .O(nJournaln)

Ce qui ne répond pas à la question et semble en fait incompatible avec l'article de Wilson. Mais je signale cela au cas où, pour gagner du temps à quiconque ayant la même idée de consulter la documentation de mise en œuvre.

J'avais initialement espéré que le pire des cas pourrait être atteint par un graphique construit en attachant un chemin à une clique, en raison de Lovász , où le temps de frappe peut être aussi élevé que . Cependant, la probabilité de cet événement est d'environ lors de la sélection des sommets de la distribution stationnaire. Par conséquent, ce qui donne un lié pour le temps de frappe moyen dans ce graphique.1Ω(n3) O(n2)1nO(n2)

Un article de Brightwell et Winkler montre qu'un sous-ensemble de graphiques de sucettes maximise le temps de frappe prévu, atteignant . Le graphique de Lovász est également un graphique de sucette, mais dans ce cas, la taille de la clique est , plutôt que la moitié. Cependant, il faut veiller à ne pas confondre le temps de frappe prévu avec le temps de frappe moyen. Ce résultat, comme le précédent, fait référence au temps de frappe attendu pour deux sommets spécifiques choisis au préalable.24n3/2723n


2
Merci d'avoir repéré cette erreur dans la documentation de graph-tool! En effet, pour les graphiques aléatoires typiques, le temps moyen de frappe est (voir par exemple arxiv.org/abs/1003.1266 ), pas . Cela sera corrigé dans la prochaine version. (Notez également que graph-tool utilise la bibliothèque de graphiques Boost en dessous, donc ce ne sont pas vraiment des implémentations distinctes.)O ( n log n )O(n)O(nJournaln)
Tiago Peixoto

1
@Tiago Je suis heureux de contribuer! Merci pour votre commentaire. Vous pouvez également être intéressé à mentionner l'heure prévue dans le pire des cas (mais peu probable), car j'ai maintenant mis à jour ma réponse avec une réponse de David Wilson.
arekolek

Réponses:


11

J'ai décidé de demander à David Wilson lui-même, peu de temps après, obtenu une réponse:

Pour les graphes non orientés sur sommets, le pire temps moyen de frappe est . L'exemple est le graphique à barres , qui se compose de deux cliques de taille reliées par un chemin de longueur . Je ne sais pas quelle est la pire constante. Le document [Brightwell-Winkler] examine les temps de frappe (attendus) commençant à et se terminant à . Le temps de frappe moyen est la moyenne de pour fixes et les choix aléatoires de partir de la distribution stationnaire d'une marche aléatoire. C'est un fait agréable que cela ne dépend pas denΘ(n3)n/3n/3H(X,y)XyH(X,y)XyX. J'ai appris les temps de frappe grâce au livre Aldous-Fill , qui est inachevé mais sur le Web.

Il y a même une preuve de ce fait dans le livre susmentionné, qui se présente comme suit:

Pour construire un graphe sur sommets, commencez par deux graphes complets sur sommets. Distinguer les sommets dans un graphique ("la cloche gauche") et les sommets dans l'autre graphique ("la cloche droite"). Connectez ensuite les graphiques via un chemin .n=2n1+n2n1vlvLvRvrvL-w1-wn2-vR

Ensuite, il est officieusement soutenu qu'il faut du temps moyen sur pour atteindre et à partir de là, il y a une chance de frapper , il faut donc environ pour frapper . A partir de il est possible que frappe la cloche droite avant de retourner dans la cloche gauche, il faut donc environ pour entrer dans la cloche droite.n1vL1n1w1n12w1w11n2n12n2

Le réglage nous donne le temps moyen .n1=n2=n/3O(n3)

Certes, je suis perdu au moment où ils déclarent:

À partir de il est possible que frappe la cloche droite avant de revenir dans la cloche gauche.w11n2

Mais pour apaiser mon esprit, j'ai exécuté une simulation de marches aléatoires sur des graphiques à barres construits de cette façon, entre des sommets choisis dans la distribution stationnaire. En effet, le temps moyen de frappe s’adaptait très bien à une courbe .(n+1)354

Cependant, les commentaires sur la preuve informelle sont toujours les bienvenus.


3

Dans un article récent , nous avons trouvé une borne supérieure mn (pas de grand O) sur le nombre attendu de "cycles sautés" par l'algorithme de Wilson et il est serré aux constantes. Cela ne répond pas directement à la question du temps de fonctionnement des algorithmes de Wilson car la taille moyenne des cycles sautés ne semble pas évidente. Par contre, je n'ai pas assez de "réputation" pour laisser un commentaire ...

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.