Afin d'obtenir cela, et pour simplifier les choses, je pense toujours d'abord en un seul paramètre avec une distribution a priori uniforme (à longue portée), de sorte que dans ce cas, l'estimation MAP du paramètre est la même que la MLE . Cependant, supposez que votre fonction de vraisemblance soit suffisamment compliquée pour avoir plusieurs maxima locaux.
Ce que fait MCMC dans cet exemple en 1-D, c'est d'explorer la courbe postérieure jusqu'à ce qu'elle trouve des valeurs de probabilité maximale. Si la variance est trop courte, vous serez certainement bloqué sur les maxima locaux, car vous échantillonnerez toujours des valeurs à proximité: l'algorithme MCMC "pensera" qu'il est bloqué sur la distribution cible. Cependant, si la variance est trop grande, une fois que vous êtes bloqué sur un maximum local, vous rejetez plus ou moins les valeurs jusqu'à ce que vous trouviez d'autres régions de probabilité maximale. S'il vous arrive de proposer la valeur au MAP (ou une région similaire de probabilité maximale locale qui est plus grande que les autres), avec une grande variance, vous finirez par rejeter presque toutes les autres valeurs: la différence entre cette région et les autres sera trop grand.
Bien sûr, tout ce qui précède affectera le taux de convergence et non la convergence "en soi" de vos chaînes. Rappelez-vous que quelle que soit la variance, tant que la probabilité de sélectionner la valeur de cette région maximale globale est positive, votre chaîne convergera.
Pour contourner ce problème, cependant, ce que l'on peut faire est de proposer différentes variations dans une période de rodage pour chaque paramètre et de viser un certain taux d'acceptation qui peut satisfaire vos besoins (disons , voir Gelman, Roberts & Gilks, 1995 et Gelman, Gilks & Roberts, 1997 pour en savoir plus sur la question du choix d'un "bon" taux d'acceptation qui, bien entendu, dépendra de la forme de votre distribution postérieure). Bien sûr, dans ce cas, la chaîne n'est pas markovienne, vous n'avez donc PAS à les utiliser pour l'inférence: vous les utilisez simplement pour ajuster la variance.0,44