Supposons que j'ai un mélange de Gaussiens finis avec des poids, des moyens et des écarts-types connus. Les moyens ne sont pas égaux. La moyenne et l'écart type du mélange peuvent être calculés, bien sûr, car les moments sont des moyennes pondérées des moments des composants. Le mélange n'est pas une distribution normale, mais est-il loin d'être normal?
L'image ci-dessus montre les densités de probabilité pour un mélange gaussien avec des moyennes de composants séparées par écarts-types (des composants) et un seul gaussien avec la même moyenne et la même variance.
Ici, les moyennes sont séparées par écart-type et il est plus difficile de séparer le mélange du gaussien à l'œil nu.
Motivation: je ne suis pas d'accord avec certaines personnes paresseuses au sujet de certaines distributions réelles qu'elles n'ont pas mesurées et qui supposent qu'elles sont proches de la normale car ce serait bien. Je suis paresseux aussi. Je ne veux pas non plus mesurer les distributions. Je veux pouvoir dire que leurs hypothèses sont incohérentes, car ils disent qu'un mélange fini de gaussiens avec des moyens différents est un gaussien qui n'a pas raison. Je ne veux pas seulement dire que la forme asymptotique de la queue est fausse car ce ne sont que des approximations qui ne sont censées être raisonnablement précises que dans quelques écarts-types de la moyenne. J'aimerais pouvoir dire que si les composants sont bien approximés par des distributions normales, alors le mélange ne l'est pas, et j'aimerais pouvoir le quantifier.
Je ne connais pas la bonne distance par rapport à la normalité à utiliser: supremum des différences entre les CDF, distance distance du déménageur, divergence KL, etc. d'autres mesures. Je serais heureux de connaître la distance au gaussien avec la même moyenne et l'écart-type que le mélange, ou la distance minimale avec n'importe quel gaussien. Si cela peut aider, vous pouvez vous limiter au cas où le mélange est de gaussiennes de sorte que le plus petit poids soit supérieur à . 2 1 / quatre