On répond à la première partie de la question dans les commentaires à la question: de nombreuses distributions "de marque" sont multimodales, comme toute distribution Beta avec a < 1 et b < 1(a,b)a<1b<1 . Passons donc à la deuxième partie de la question.
Toutes les distributions discrètes sont clairement des mélanges (d'atomes, qui sont unimodaux).
Je montrerai que la plupart des distributions continues sont également des mélanges de distributions unimodales. L'intuition derrière cela est simple: nous pouvons "poncer" les bosses d'un graphique cahoteux d'un PDF, un par un, jusqu'à ce que le graphique soit horizontal. Les bosses deviennent les composants du mélange, dont chacun est évidemment unimodal.
Par conséquent, à l'exception peut-être de certaines distributions inhabituelles dont les PDF sont très discontinus, la réponse à la question est «aucune»: toutes les distributions multimodales qui sont absolument continues, discrètes ou une combinaison de ces deux sont des mélanges de distributions unimodales.
Envisagez des distributions continues dont les PDFs fFf sont continus (ce sont les distributions "absolument continues"). (La continuité n'est pas vraiment une limitation; elle peut être encore assouplie par une analyse plus approfondie, en supposant simplement que les points de discontinuité sont discrets.)
Pour faire face aux "plateaux" de valeurs constantes qui peuvent se produire, définissez un "mode" comme étant un intervalle (qui pourrait être un point unique où x l =m=[xl,xu] ) tel quexl=xu
a une valeur constante sur m ,fm, disons .y
f n'est constant sur aucun intervalle qui contient strictement .m
Il existe un nombre positif tel que la valeur maximale de f atteinte sur [ x l - ϵ ,ϵf[xl−ϵ,xu+ϵ] est égale à .y
Soit tout mode de f . Parce que f est continu, il y a des intervalles [ x ′ l , x ′ u ] contenant m pour lesquels f est non décroissant dans [ x ′ l , x l ] (qui est un intervalle approprié, pas seulement un point) et non croissant dans [ x u , x ′ u ]m=[xl,xu]ff[x′l,x′u]mf[x′l,xl][xu,x′u](qui est également un intervalle approprié). Soit u le supremum de toutes ces valeurs. est l'infinimum de toutes ces valeurs etx ′x′lx′u
Cette construction a défini une "bosse" sur le graphe de s'étendant de x ' l à x ' u . Soit y le plus grand de f ( x ′ l ) et f ( x ′ u ) . Par construction, l'ensemble des points x dans [ x ′ l , x ′ u ] pour lesquels f ( x ) ≥ yfx′lx′uyf(x′l)f(x′u)x[x′l,x′u]f(x)≥y est un intervalle propre m′contenant strictement (car il contient soit l'ensemble de [ x ′ l , x l ] ou [ x u , x ′ u ] ).m[x′l,xl][xu,x′u]
Dans cette illustration d'un PDF multimodal, un mode est identifié par un point rouge sur l'axe horizontal. L'étendue horizontale de la portion rouge du remblai est l'intervalle m ' : c'est la base de la bosse déterminée par le mode m . La base de cette bosse est à la hauteur y ≈ 0,16 . Le PDF d'origine est la somme du remplissage rouge et du remplissage bleu. Notez que le remplissage bleu n'a qu'un seul mode près de 2 ; le mode d'origine à [ 0 , 0 ] a été supprimé.m=[0,0]m′my≈0.162[0,0]
Écriture pour la durée de|m′| , définirm′
pm=PrF(m′)−y|m′|
et
fm(x)=f(x)−ypm
quand et f m ( x ) = 0 sinon. (Cela fait incidemment f m une fonction continue.) Le numérateur est la quantité par laquelle f s'élève au-dessus de y et le dénominateur p m est l'aire entre le graphique de f et y . Ainsi f m est non négatif et a une aire totale 1 : c'est le PDF d'une distribution de probabilité. Par construction, il a un mode unique m .x∈m′fm(x)=0fmfypmfyfm1m
Aussi par construction, la fonction
f′m(x)=f(x)−pmfm(x)1−pm
is a PDF provided pm<1. (Obviously if pm=1 there is nothing left of f, which must have been unimodal to begin with.) Moreover, it has no modes in the interval m′ (where it is constant, which is why the previous careful definition of a mode as an interval was necessary). Furthermore,
f(x)=pmfm(x)+(1−pm)f′m(x)
is a mixture of the unimodal PDF fm and the PDF f′m.
Iterate this procedure with f′m (which as a linear combination of continuous functions is still a continuous function, enabling us to proceed as before), producing a sequence of modes m=m1,m2,…; corresponding sequences of weights p1=pm,p2=pm2,…; and PDFs f1=fm,f2=fm2,…. The limiting result exists because (a) the interval where fi is flattened includes a proper interval that had not been flattened in the preceding i−1 operations and (b) the real numbers cannot be decomposed into more than a countable number of such intervals. The limit cannot have any modes and therefore is constant, which must be zero (for otherwise its integral would diverge). Consequently, f has been expressed (perhaps not uniquely, because the order in which modes were selected will matter) as a mixture
f(x)=∑ipifi(x)
of unimodal distributions, QED.