J'ai implémenté une VAE et j'ai remarqué deux implémentations différentes en ligne de la divergence gaussienne KL univariée simplifiée. La divergence d' origine que par ici est Si nous supposons que notre a priori est une unité gaussienne, c'est-à-dire et , cela se simplifie jusqu'à Et voici où repose ma confusion. Bien que j'ai trouvé quelques dépôts github obscurs avec l'implémentation ci-dessus, ce que je trouve le plus couramment utilisé est: μ2=0σ2=1KLloss=-log(σ1)+σ 2 1 +μ 2 1