La variance est le deuxième moment moins le carré du premier moment, il suffit donc de calculer des moments de mélanges.
En général, étant donné les distributions avec PDFs et les poids constants (non aléatoires) , le PDF du mélange estfipi
f(x)=∑ipifi(x),
à partir de laquelle il suit immédiatement pour tout moment quek
μ(k)=Ef[xk]=∑ipiEfi[xk]=∑ipiμ(k)i.
J'ai écrit pour le moment de et pour le moment de .μ(k)kthfμ(k)ikthfi
En utilisant ces formules, la variance peut être écrite
Var(f)=μ(2)−(μ(1))2=∑ipiμ(2)i−(∑ipiμ(1)i)2.
De façon équivalente, si les variances du sont données sous la forme , alors , permettant d' écrire la variance du mélange en termes de variances et de moyennes de ses composants ainsi quefiσ2iμ(2)i=σ2i+(μ(1)i)2f
Var(f)=∑ipi(σ2i+(μ(1)i)2)−(∑ipiμ(1)i)2=∑ipiσ2i+∑ipi(μ(1)i)2−(∑ipiμ(1)i)2.
En mots, il s’agit de la variance moyenne (pondérée) plus la moyenne quadratique moyenne moins le carré de la moyenne. Parce que la quadrature est une fonction convexe, Inégalité de Jensen affirme que la moyenne quadratique moyenne ne peut être inférieure au carré de la moyenne moyenne. Cela nous permet de comprendre la formule en indiquant que la variance du mélange est le mélange des variances plus un terme non négatif représentant la dispersion (pondérée) des moyennes.
Dans votre cas, la variance est
pAσ2A+pBσ2B+[pAμ2A+pBμ2B−(pAμA+pBμB)2].
Nous pouvons interpréter cela comme un mélange pondéré des deux variances, , plus un terme de correction (nécessairement positif) pour tenir compte des écarts entre les moyennes individuelles et la moyenne globale des mélanges.pAσ2A+pBσ2B
L'utilité de cette divergence dans l'interprétation des données, telle que donnée dans la question, est douteuse, car la distribution du mélange ne sera pas normale (et peut s'en écarter sensiblement, au point de montrer une bimodalité).