Pourquoi toutes les distributions connues sont-elles unimodales?


13

Je ne connais aucune distribution multimodale.

Pourquoi toutes les distributions connues sont-elles unimodales? Y a-t-il une distribution "célèbre" qui a plus d'un mode?

Bien sûr, les mélanges de distributions sont souvent multimodaux, mais j'aimerais savoir s'il existe des distributions "non-mélange" qui ont plus d'un mode.


5
Vous parlez de distributions "standard" plutôt que de distributions "connues"
Stéphane Laurent

12
Que diriez-vous de bêta avec ? α=β=0.5
amibe dit Réintégrer Monica

1
Si cela ne vous dérange pas les distributions bimodales bornées , Wikipedia mentionne également la distribution U-quadratique et la courbe d'arc sinus . Je pense que ce ne sont que des cas particuliers de la distribution bêta ... Wikipedia mentionne également quelques exemples d'occurrences naturelles de distributions multimodales .
Nick Stauner

12
@ StéphaneLaurent: J'aime les "distributions de marque" , car véhiculer qu'être nommé n'implique pas en soi un statut particulier pour une distribution. Les distributions "connues" donnent l'impression que le reste peut être quelque part en attente d'être découvert, comme le monstre du Loch-Ness ou la matière noire.
Scortchi - Réintégrer Monica

5
Excellent @Scortchi, grand vocabulaire! Beaucoup de scientifiques non mathématiciens que j'ai rencontrés ont l'impression qu'il n'existe pas de distribution sans nom. Peut-être y a-t-il un fait philosophique plus profond connexe derrière cela, la confusion d'un nom et de la chose désignée par ce nom (comme l'a dit Russell, "Le mot 'chien' ne ressemble pas à un chien",)
Stéphane Laurent

Réponses:


17

On répond à la première partie de la question dans les commentaires à la question: de nombreuses distributions "de marque" sont multimodales, comme toute distribution Beta avec a < 1 et b < 1(a,b)a<1b<1 . Passons donc à la deuxième partie de la question.

Toutes les distributions discrètes sont clairement des mélanges (d'atomes, qui sont unimodaux).

Je montrerai que la plupart des distributions continues sont également des mélanges de distributions unimodales. L'intuition derrière cela est simple: nous pouvons "poncer" les bosses d'un graphique cahoteux d'un PDF, un par un, jusqu'à ce que le graphique soit horizontal. Les bosses deviennent les composants du mélange, dont chacun est évidemment unimodal.

Par conséquent, à l'exception peut-être de certaines distributions inhabituelles dont les PDF sont très discontinus, la réponse à la question est «aucune»: toutes les distributions multimodales qui sont absolument continues, discrètes ou une combinaison de ces deux sont des mélanges de distributions unimodales.


Envisagez des distributions continues dont les PDFs fFf sont continus (ce sont les distributions "absolument continues"). (La continuité n'est pas vraiment une limitation; elle peut être encore assouplie par une analyse plus approfondie, en supposant simplement que les points de discontinuité sont discrets.)

Pour faire face aux "plateaux" de valeurs constantes qui peuvent se produire, définissez un "mode" comme étant un intervalle (qui pourrait être un point unique où x l =m=[xl,xu] ) tel quexl=xu

  1. a une valeur constante sur m ,fm, disons .y

  2. f n'est constant sur aucun intervalle qui contient strictement .m

  3. Il existe un nombre positif tel que la valeur maximale de f atteinte sur [ x l - ϵ ,ϵf[xlϵ,xu+ϵ] est égale à .y

Soit tout mode de f . Parce que f est continu, il y a des intervalles [ x l , x u ] contenant m pour lesquels f est non décroissant dans [ x l , x l ] (qui est un intervalle approprié, pas seulement un point) et non croissant dans [ x u , x u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu](qui est également un intervalle approprié). Soit u le supremum de toutes ces valeurs. est l'infinimum de toutes ces valeurs etxxlxu

Cette construction a défini une "bosse" sur le graphe de s'étendant de x ' l à x ' u . Soit y le plus grand de f ( x l ) et f ( x u ) . Par construction, l'ensemble des points x dans [ x l , x u ] pour lesquels f ( x ) yfxlxuyf(xl)f(xu)x[xl,xu]f(x)y est un intervalle propre mcontenant strictement (car il contient soit l'ensemble de [ x l , x l ] ou [ x u , x u ] ).m[xl,xl][xu,xu]

Figure

Dans cette illustration d'un PDF multimodal, un mode est identifié par un point rouge sur l'axe horizontal. L'étendue horizontale de la portion rouge du remblai est l'intervalle m ' : c'est la base de la bosse déterminée par le mode m . La base de cette bosse est à la hauteur y 0,16 . Le PDF d'origine est la somme du remplissage rouge et du remplissage bleu. Notez que le remplissage bleu n'a qu'un seul mode près de 2 ; le mode d'origine à [ 0 , 0 ] a été supprimé.m=[0,0]mmy0.162[0,0]

Écriture pour la durée de|m| , définirm

pm=PrF(m)y|m|

et

fm(x)=f(x)ypm

quand et f m ( x ) = 0 sinon. (Cela fait incidemment f m une fonction continue.) Le numérateur est la quantité par laquelle f s'élève au-dessus de y et le dénominateur p m est l'aire entre le graphique de f et y . Ainsi f m est non négatif et a une aire totale 1 : c'est le PDF d'une distribution de probabilité. Par construction, il a un mode unique m .xmfm(x)=0fmfypmfyfm1m

Aussi par construction, la fonction

fm(x)=f(x)pmfm(x)1pm

is a PDF provided pm<1. (Obviously if pm=1 there is nothing left of f, which must have been unimodal to begin with.) Moreover, it has no modes in the interval m (where it is constant, which is why the previous careful definition of a mode as an interval was necessary). Furthermore,

f(x)=pmfm(x)+(1pm)fm(x)

is a mixture of the unimodal PDF fm and the PDF fm.

Iterate this procedure with fm (which as a linear combination of continuous functions is still a continuous function, enabling us to proceed as before), producing a sequence of modes m=m1,m2,; corresponding sequences of weights p1=pm,p2=pm2,; and PDFs f1=fm,f2=fm2,. The limiting result exists because (a) the interval where fi is flattened includes a proper interval that had not been flattened in the preceding i1 operations and (b) the real numbers cannot be decomposed into more than a countable number of such intervals. The limit cannot have any modes and therefore is constant, which must be zero (for otherwise its integral would diverge). Consequently, f has been expressed (perhaps not uniquely, because the order in which modes were selected will matter) as a mixture

f(x)=ipifi(x)

of unimodal distributions, QED.


7

By unimodal, I think the OP plainly means that there is just one interior mode (i.e. excluding corner solutions). The question is thus really asking ...

why is it that brand name distributions do NOT have more than one interior mode?

i.e. why do most brand name distributions look something like this:

enter image description here

... plus or minus some skewness or some discontinuities? When the question is posed thus, the Beta distribution would not be a valid counter example.

It appears the OP's conjecture has some validity: most common brand name distributions do not allow for more than one interior mode. There may be theoretical reasons for this. For example, any distribution that is a member of the Pearson family (which includes the Beta) will necessarily be (interior) unimodal, as a consequence of the parent differential eqn that defines the entire family. And the Pearson family nests most of the best-known brand names.

Nevertheless, here are some brand name counter examples ...

Counter example

One brand-name counter-example is the Sinc2 distribution with pdf:

f(x)=sin2(x)πx2

defined on the real line. Here is a plot of the Sinc2 pdf:

enter image description here

We could also perhaps add the family of cardiod and distributions related to this class ... with pdf plots such as:

enter image description here

The family of reflected brand name distributions would also perhaps be possible brand name contenders (though, these might be thought of as a 'cheat solution' ... but they are still brand names) such as the Reflected Weibull shown here:

enter image description here


1
My, that plot of Sinc2 sure looks like it has some negative values! (Could that be a plotting artifact?) ... And the cardioid distributions look like they have only one interior mode each.
whuber

1
Hi @whuber ... must agree re the plotting artefact (I will take that up on Mathematica SE !). Re cardiod family: idea is that one can extend the domain of such families as one please, and like a sine wave, it keeps on giving :)
wolfies

1
(+1) It is a strange artifact: your last plot (of reflected distributions) does not seem to exhibit it. You might trace the generation of plot points in the Sinc2 plot to see where they lie; I suspect the slight negative values might be an overshooting of a spline of a small number of points.
whuber

I think it is just because the plotted line is thicker than the axis line, so appears to 'overshoot' the axis when close to zero. If the line is plotted thinner, the artefact disappears.
wolfies

But there is no such artifact in your bottom figure, which also has lines thicker than the axis.
whuber

3

That you mightn't think of any doesn't mean there aren't any.

I can name "known" distributions that aren't unimodal.

For example, a Beta distribution with α and β both <1.

http://en.wikipedia.org/wiki/Beta_distribution

also see

http://en.wikipedia.org/wiki/U-quadratic_distribution

(This isn't a special case of the beta distribution, in spite of the comment that says it is. The two families have some overlap, however.)

Mixture distributions are certainly known, and many of those are multimodal.


The U-quadratic is a truncated Beta distribution.
becko

1

Alpha-skew-normal distribution (Elal-Olivero 2010) has a PDF:

(1αxμσ)2+12+α2φ(xμσ),

where φ is the PDF of a standard Gaussian.

For |α|>1.34 the distribution is bimodal. Examplary plot for μ=1,σ=0.5,a=2:

enter image description here

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.