Quelqu'un peut-il expliquer l'idée principale derrière les méthodes Hamiltoniennes Monte Carlo et dans quels cas elles donneront de meilleurs résultats que les méthodes Markov Chain Monte Carlo?
Quelqu'un peut-il expliquer l'idée principale derrière les méthodes Hamiltoniennes Monte Carlo et dans quels cas elles donneront de meilleurs résultats que les méthodes Markov Chain Monte Carlo?
Réponses:
Je crois que la source la plus à jour sur le Hamiltonian Monte Carlo, ses applications pratiques et sa comparaison avec d'autres méthodes MCMC est ce document de synthèse de Betancourt daté de 2017 :
Le défi ultime dans l'estimation des attentes probabilistes est de quantifier l'ensemble typique de la distribution cible, un ensemble qui se concentre près d'une surface complexe dans l'espace des paramètres. Le hamiltonien Monte Carlo génère une exploration cohérente des distributions cibles lisses en exploitant la géométrie de l'ensemble typique. Cette exploration efficace donne non seulement une meilleure efficacité de calcul que les autres algorithmes de Monte Carlo à chaîne de Markov, mais également des garanties plus solides sur la validité des estimateurs résultants. De plus, une analyse minutieuse de cette géométrie facilite des stratégies fondées sur des principes pour construire automatiquement des implémentations optimales de la méthode, permettant aux utilisateurs de concentrer leur expertise sur la construction de meilleurs modèles au lieu de lutter contre les frustrations du calcul statistique. Par conséquent,Stan (Stan Development Team, 2017).
Hamiltonian Monte Carlo ( HMC ), à l'origine appelé Hybrid Monte Carlo, est une forme de Markov Chain Monte Carlo avec un terme de momentum et des corrections.
Le «hamiltonien» fait référence à la mécanique hamiltonienne.
Le cas d'utilisation explore stochastiquement (au hasard) des dimensions élevées pour l'intégration numérique sur un espace de probabilité.
Plain / vanilla Markov Chain Monte Carlo (MCMC) utilise uniquement le dernier état pour déterminer l'état suivant. Cela signifie que vous êtes aussi susceptible d'aller de l'avant que de revenir sur l'espace que vous avez déjà exploré.
Le MCMC est également susceptible de dériver à l'extérieur de la zone d'intérêt principale dans les espaces de grande dimension également.
Cela rend MCMC très inefficace aux fins de l'intégration numérique sur un espace de probabilité multidimensionnel.
En ajoutant un terme d'élan, la console HMC rend l'exploration de l'espace de probabilité plus efficace, car vous êtes désormais plus susceptible de progresser à chaque étape de votre espace de probabilité.
HMC utilise également les corrections Metropolis-Hastings pour s'assurer qu'il reste dans et explore la région de plus grande probabilité.
En rédigeant cette réponse, j'ai trouvé cette présentation sur la console HMC assez éclairante.