KL divergence entre deux gaussiennes univariées

Je dois déterminer la divergence KL entre deux Gaussiennes. Je compare mes résultats à ceux - ci , mais je ne peux pas reproduire leurs résultats. Mon résultat est évidemment faux, car le KL n'est pas 0 pour KL (p, p).

Je me demande où je fais une erreur et demande si quelqu'un peut la repérer.

Soit $p(x) = N(\mu_1, \sigma_1)$ et $q(x) = N(\mu_2, \sigma_2)$ . De PRML Bishop je sais que

K L (p, q) = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x

$KL(p, q) = - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx$

où l'intégration est faite sur toute la ligne réelle, et que

\int p (x) \log p (x) d x = - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}),

$\int p(x) \log p(x) dx = -\frac{1}{2} (1 + \log 2 \pi \sigma_1^2),$

donc je me limite à $\int p(x) \log q(x) dx$ , que je peux écrire comme

- \int p (x) \log \frac{1}{(2 π σ_{2}^{2})^{(1 / 2)}} e^{- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}} d x,

$-\int p(x) \log \frac{1}{(2 \pi \sigma_2^2)^{(1/2)}} e^{-\frac{(x-\mu_2)^2}{2 \sigma_2^2}} dx,$

qui peut être séparé en

\frac{1}{2} \log (2 π σ_{2}^{2}) - \int p (x) \log e^{- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}} d x .

$\frac{1}{2} \log (2 \pi \sigma_2^2) - \int p(x) \log e^{-\frac{(x-\mu_2)^2}{2 \sigma_2^2}} dx.$

Je prends le journal

\frac{1}{2} \log (2 π σ_{2}^{2}) - \int p (x) (- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}) d x,

$\frac{1}{2} \log (2 \pi \sigma_2^2) - \int p(x) \bigg(-\frac{(x-\mu_2)^2}{2 \sigma_2^2} \bigg) dx,$

où je sépare les sommes et obtient $\sigma_2^2$ de l'intégrale.

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{\int p (x) x^{2} d x - \int p (x) 2 x μ_{2} d x + \int p (x) μ_{2}^{2} d x}{2 σ_{2}^{2}}

$\frac{1}{2} \log (2 \pi \sigma^2_2) + \frac{\int p(x) x^2 dx - \int p(x) 2x\mu_2 dx + \int p(x) \mu_2^2 dx}{2 \sigma_2^2}$

Letting $\langle \rangle$ désignent l'opérateur d'espérance sous $p$ , je peux réécrire ce que

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{⟨ x^{2} ⟩ - 2 ⟨ x ⟩ μ_{2} + μ_{2}^{2}}{2 σ_{2}^{2}} .

$\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\langle x^2 \rangle - 2 \langle x \rangle \mu_2 + \mu_2^2}{2 \sigma_2^2}.$

$var(x) = \langle x^2 \rangle - \langle x \rangle ^2$

⟨ x^{2} ⟩ = σ_{1}^{2} + μ_{1}^{2}

$\langle x^2 \rangle = \sigma_1^2 + \mu_1^2$

et donc

\frac{1}{2} \log (2 π σ^{2}) + \frac{σ_{1}^{2} + μ_{1}^{2} - 2 μ_{1} μ_{2} + μ_{2}^{2}}{2 σ_{2}^{2}},

$\frac{1}{2} \log (2 \pi \sigma^2) + \frac{\sigma_1^2 + \mu_1^2 - 2 \mu_1 \mu_2 + \mu_2^2}{2 \sigma_2^2},$

que je peux mettre comme

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} .

$\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2}.$

Tout mettre ensemble, je dois

\begin{aligned} K L (p, q) & = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x \\ = \frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}) \\ = \log \frac{σ_{2}}{σ_{1}} + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} . \end{aligned}

$\begin{align*} KL(p, q) &= - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx\\\\ &= \frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)\\\\ &= \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2}. \end{align*}$

1

$1$

Quelqu'un peut-il repérer mon erreur?

Mise à jour

Merci à mpiktas pour avoir clarifié les choses. La bonne réponse est:

$KL(p, q) = \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2}$

normal-distribution kullback-leibler

— Bayerj
source

x - μ_{1}

$x-\mu_1$

Qu'en est-il du cas multi variable?

Je viens de voir dans un article de recherche que kld devrait être $ KL (p, q) = ½ * ((μ₁-μ₂) ² + σ₁² + σ₂²) * ((1 / σ₁²) + (1 / σ₂²)) - 2

— skyde

\int p (x) \log p (x) d x = \frac{1}{2} (1 + \log 2 π σ_{1}^{2})

$\int p(x) \log p(x) dx = \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)$

\int p (x) \log p (x) d x = - \frac{1}{2} (1 + \log 2 π σ_{1}^{2})

$\int p(x) \log p(x) dx = -\frac{1}{2} (1 + \log 2 \pi \sigma_1^2)$

La réponse se trouve également dans mon document de 1996 sur les pertes intrinsèques .

— Xi'an

Réponses:

OK, mon mauvais. L'erreur est dans la dernière équation:

\begin{aligned} K L (p, q) & = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x \\ = \frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}) \\ = \log \frac{σ_{2}}{σ_{1}} + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} \end{aligned}

$\begin{align} KL(p, q) &= - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx\\\\ &=\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)\\\\ &= \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} \end{align}$

$-\frac{1}{2}$ $\mu_1=\mu_2$ $\sigma_1=\sigma_2$

— mpiktas
source

@mpiktas Je voulais dire vraiment la question - bayerj est un chercheur bien publié et je suis un étudiant de premier cycle. C'est bien de voir que même les types malins se rabattent parfois sur Internet :)

— N. McA.

μ_{1} σ_{1}

$\mu_1 \sigma_1$

μ_{2} σ_{2}

$\mu_2 \sigma_2$

N (u_{1}, σ_{1})

$N(u_1, \sigma_1)$

$p$ $\mu_1$ $\sigma^2_1$ $q$ $\mu_2$ $\sigma^2_2$ $q$ $p$

$\int \left[\log( p(x)) - log( q(x)) \right] p(x) dx$

$=\int \left[ -\frac{1}{2} \log(2\pi) - \log(\sigma_1) - \frac{1}{2} \left(\frac{x-\mu_1}{\sigma_1}\right)^2 + \frac{1}{2}\log(2\pi) + \log(\sigma_2) + \frac{1}{2} \left(\frac{x-\mu_2}{\sigma_2}\right)^2 \right]$ $\times \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[-\frac{1}{2}\left(\frac{x-\mu_1}{\sigma_1}\right)^2\right] dx$

$=\int \left\{\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2} \left[ \left(\frac{x-\mu_2}{\sigma_2}\right)^2 - \left(\frac{x-\mu_1}{\sigma_1}\right)^2 \right] \right\}$ $\times \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[-\frac{1}{2}\left(\frac{x-\mu_1}{\sigma_1}\right)^2\right] dx$

$=E_{1} \left\{\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2} \left[ \left(\frac{x-\mu_2}{\sigma_2}\right)^2 - \left(\frac{x-\mu_1}{\sigma_1}\right)^2 \right]\right\}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} E_1 \left\{(X-\mu_2)^2\right\} - \frac{1}{2\sigma_1^2} E_1 \left\{(X-\mu_1)^2\right\}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} E_1 \left\{(X-\mu_2)^2\right\} - \frac{1}{2}$

$(X - \mu_2)^2 = (X-\mu_1+\mu_1-\mu_2)^2 = (X-\mu_1)^2 + 2(X-\mu_1)(\mu_1-\mu_2) + (\mu_1-\mu_2)^2$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} \left[E_1\left\{(X-\mu_1)^2\right\} + 2(\mu_1-\mu_2)E_1\left\{X-\mu_1\right\} + (\mu_1-\mu_2)^2\right] - \frac{1}{2}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{\sigma_1^2 + (\mu_1-\mu_2)^2}{2\sigma_2^2} - \frac{1}{2}$

— ocram
source