Bien que j'aie fait de la programmation avec des machines Boltzmann dans un cours de physique, je ne connais pas leur caractérisation théorique. En revanche, j'en connais un peu sur la théorie des modèles graphiques (sur les premiers chapitres du livre de Lauritzen Graphical Models ).
Question: Existe - t-il une relation significative entre les modèles graphiques et la machine Boltzmann? La machine Boltzmann est-elle un type de modèle graphique?
De toute évidence, la machine Boltzmann est un type de réseau neuronal. J'ai entendu dire que certains réseaux de neurones sont mathématiquement liés aux modèles graphiques et que certains ne le sont pas.
Questions connexes sur CrossValidated qui ne répondent pas à ma question:
Ceci est similaire à une question précédente qui a été posée auparavant: Quelle est la relation entre les modèles hiérarchiques, les réseaux de neurones, les modèles graphiques, les réseaux bayésiens? mais est plus spécifique.
De plus, la réponse acceptée à cette question ne clarifie pas ma confusion - même si les nœuds dans la représentation graphique standard d'un réseau de neurones ne représentent pas des variables aléatoires, cela ne signifie pas nécessairement qu'aucune telle représentation n'existe. Plus précisément, je pense à la façon dont les nœuds dans la représentation graphique typique des chaînes de Markov représentent l'ensemble des états possibles plutôt que les variables aléatoires , mais on pourrait également créer un graphique montrant les relations de dépendance conditionnelle entre les X i, ce qui montre que chaque chaîne de Markov est en fait un champ aléatoire de Markov. La réponse dit également que les réseaux de neurones (incluant vraisemblablement les machines Boltzmann) sont "discriminatoires", mais n'entre pas dans les détails pour expliquer ce que signifie cette affirmation, et la question de suivi évidente "les modèles graphiques ne sont-ils pas discriminatoires?" adressé. De même, la réponse acceptée renvoie au site Web de Kevin Murphy (j'ai en fait lu une partie de sa thèse de doctorat en découvrant les réseaux bayésiens), mais ce site Web ne traite que des réseaux bayésiens et ne mentionne pas du tout les réseaux de neurones - il ne parvient donc pas à expliquer comment ils sont différents.
Cette autre question est probablement plus similaire à la mienne: Modéliser mathématiquement les réseaux de neurones comme des modèles graphiques Cependant, aucune des réponses n'a été acceptée, et de même ne donne que des références mais n'explique pas les références (par exemple cette réponse ). Si un jour, j'espère être en mesure de comprendre les références, je suis actuellement à un niveau de connaissance de base et j'apprécierais le plus une réponse aussi simplifiée que possible. De plus, le cours de Toronto lié à dans la réponse du haut ( http://www.cs.toronto.edu/~tijmen/csc321/lecture_notes.shtml ) répond à cela, mais pas très en détail. De plus, les notes de la conférence qui pourraient répondre à ma question ne sont pas accessibles au public.
25 mars Conférence 13b: Belief Nets 7:43. Pour cette diapositive, gardez à l'esprit les machines Boltzmann. Là aussi, nous avons des unités cachées et des unités visibles, et tout est probabiliste. Les BM et les SBN ont plus en commun qu'ils n'ont de différences. 9:16. De nos jours, les «modèles graphiques» sont parfois considérés comme une catégorie spéciale de réseaux de neurones, mais dans l'histoire qui est décrite ici, ils étaient considérés comme des types de systèmes très différents.