Pour ajouter aux excellentes réponses de Carlos et Xi'an , il est également intéressant de noter qu'une condition suffisante pour que la divergence KL soit finie est que les deux variables aléatoires aient le même support compact et que la densité de référence soit limitée . Ce résultat établit également une borne implicite pour le maximum de la divergence KL (voir théorème et preuve ci-dessous).
Théorème: Si les densités et q ont le même support compact X et que la densité p est bornée sur ce support (c'est-à-dire qu'elle a une borne supérieure finie) alors K L ( P | | Q ) < ∞ .pqXpKL(P||Q)<∞
Preuve: Puisque a un support compact X, cela signifie qu'il existe une valeur infimum positive:qX
q–≡infx∈Xq(x)>0.
De même, puisque a un support compact X, cela signifie qu'il existe une valeur de supremum positive:pX
p¯≡supx∈Xp(x)>0.
De plus, comme ce sont les deux densités sur le même support, et que ce dernier est borné, on a . Cela signifie que:0<q–⩽p¯<∞
supx∈Xln(p(x)q(x))⩽ln(p¯)−ln(q–).
Maintenant, en laissant la dernière borne supérieure, nous avons clairement 0 ⩽ L _ < ∞ de sorte que:L––≡ln(p¯)−ln(q–)0⩽L––<∞
KL(P||Q)=∫Xln(p(x)q(x))p(x)dx⩽supx∈Xln(p(x)q(x))∫Xp(x)dx⩽(ln(p¯)−ln(q–))∫Xp(x)dx=L––<∞.
■