Y a-t-il une distribution en forme de plateau?


30

Je recherche une distribution où la densité de probabilité diminue rapidement après un certain point loin de la moyenne, ou selon mes propres mots une "distribution en forme de plateau".

Quelque chose entre le gaussien et l'uniforme.


8
Vous pouvez additionner un RV gaussien et un RV uniforme.
StrongBad

3
On entend parfois parler de distributions dites platykurtiques .
JM n'est pas statisticien

Réponses:


53

Vous recherchez peut-être une distribution connue sous les noms de distribution généralisée normale (version 1) , de distribution Subbotin ou de distribution d'énergie exponentielle. Il est paramétré par emplacement , échelle et forme avec pdfσ βμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

comme vous pouvez le constater, pour il ressemble et converge vers la distribution de Laplace, avec il converge vers la normale, et quand vers une distribution uniforme.β = 2 β = β=1β=2β=

entrez la description de l'image ici

Si vous recherchez un logiciel qui l'a implémenté, vous pouvez vérifier la normalpbibliothèque pour R (Mineo et Ruggieri, 2005). Ce qui est bien avec ce paquet, c'est qu'il implémente entre autres la régression avec des erreurs généralisées normalement distribuées, c'est-à-dire en minimisant la norme .Lp


Mineo, AM et Ruggieri, M. (2005). Un outil logiciel pour la distribution d'énergie exponentielle: le package normalp. Journal of Statistical Software, 12 (4), 1-24.


20

Le commentaire de StrongBad est une très bonne suggestion. La somme d'un RV uniforme et d'un RV gaussien peut vous donner exactement ce que vous recherchez si vous choisissez les bons paramètres. Et il a en fait une solution de forme fermée assez agréable.

Le pdf de cette variable est donné par l'expression:

14une[erF(X+uneσ2)-erF(X-uneσ2)]

σune est le "rayon" du RV uniforme à moyenne nulle. est l'écart type du RV gaussien à moyenne nulle.σ

PDFs


3
Référence: Bhattacharjee, GP, Pandit, SNN et Mohan, R. 1963. Chaînes dimensionnelles impliquant des distributions d'erreur rectangulaires et normales. Technometrics, 5, 404–406.
Tim

15

Il existe un nombre infini de distributions "en forme de plateau".

Étiez-vous après quelque chose de plus spécifique que "entre le gaussien et l'uniforme"? C'est un peu vague.

En voici une simple: vous pouvez toujours coller une demi-normale à chaque extrémité d'un uniforme:

Densité à centre uniforme et queues gaussiennes

Vous pouvez contrôler la "largeur" ​​de l'uniforme par rapport à l'échelle de la normale afin d'avoir des plateaux plus larges ou plus étroits, donnant toute une classe de distributions, qui incluent le gaussien et l'uniforme comme cas limites.

La densité est:

h2πσe-12σ2(X-μ+w/2)2jeXμ-w/2+h2πσjeμ-w/2<Xμ+w/2+h2πσe-12σ2(X-μ-w/2)2jeX>μ+w/2

h=11+w/(2πσ)

Comme pour fixe , nous approchons l'uniforme sur et comme pour fixe nous approchons .σ0w(μ-w/2,μ+w/2)w0σN(μ,σ2)

Voici quelques exemples (avec dans chaque cas):μ=0

Diagramme de divers exemples de cet uniforme à queue gaussienne

On pourrait peut-être appeler cette densité un "uniforme à queue gaussienne".


1
Ach! J'aime assister à des balles officielles portant un uniforme Gausian à queue! ;)
Alexis

7

Voir ma distribution "Devil's tower" ici [1]:

F(X)=0,3333 , pour ; , pour ; et , pour.|X|<0,9399
F(X)=0,2945/X20,9399|X|<2.3242
F(X)=02.3242|X|

Fonction de densité de tour du diable avec dessus plat, côtés convexes, coupés aux extrémités

La distribution "slip-dress" est encore plus intéressante.

Il est facile de construire des distributions ayant la forme que vous souhaitez.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Stat. 68 (3): 191-195. doi: 10.1080 / 00031305.2014.917055
accès public pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Salut Peter - J'ai pris la liberté de donner la fonction et d'insérer une image ainsi que de donner une référence complète. (Si ma mémoire est bonne, je pense que Kendall et Stuart donnent les détails d'un démystification similaire dans leur texte classique. Si je me souviens bien - cela fait longtemps - je crois qu'ils discutent également du fait que ce n'est pas de la lourdeur)
Glen_b -Reinstate Monica

Merci, Glen_b. Je n'ai jamais dit que le kurtosis mesurait ce que mesuraient les nombres d'indice de queue. Au contraire, mon article prouve que le kurtosis est, pour une classe de distributions très large, presque égal à E (Z ^ 4 * I (| Z |> 1)). Ainsi, le kurtosis ne vous dit clairement rien sur le «pic», qui se trouve généralement dans la plage {Z: | Z | <1}. Il est plutôt déterminé principalement par les queues. Appelez-le E (Z ^ 4 * I (| Z |> 1)) si le terme "lourdeur" a une autre signification.
Peter Westfall

De plus, @Glen_b à quel index de queue faites-vous référence? Il y en a infiniment. Les croisements de queue ne définissent pas correctement la «queue». Selon certaines définitions de la lourdeur de la queue qui traversent la queue, N (0,1) est plus "à queue lourde" que .9999 * U (-1,1) + .0001 * U (-1000,1000), bien que cette dernière soit évidemment à queue plus lourde, malgré des queues finies. Et, BTW, ce dernier a un kurtosis extrêmement élevé, contrairement à N (0,1).
Peter Westfall

Je ne peux pas me trouver disant "index de queue" n'importe où dans mon commentaire; Je ne sais pas trop de quoi vous parlez là-bas lorsque vous dites "à quel indice de queue faites-vous référence". Si vous voulez parler de la lourdeur, la meilleure chose à faire est de vérifier ce que Kendall et Stuart disent réellement; Je crois que là-bas, ils comparent en fait le rapport asymptotique des densités pour les variables standardisées symétriques, mais il pourrait peut-être s'agir de fonctions de survivant; le point était le leur, pas le mien
Glen_b -Reinstate Monica

Étrange. Eh bien, de toute façon, Kendall et Stuart se sont trompés. Le kurtosis est évidemment une mesure du poids de la queue comme le prouvent mes théorèmes.
Peter Westfall

5

Beaucoup de bonnes réponses. La solution proposée ici a 2 caractéristiques: (i) qu'elle a une forme fonctionnelle particulièrement simple, et (ii) que la distribution résultante produit nécessairement un pdf en forme de plateau (et pas seulement comme un cas spécial). Je ne sais pas si cela a déjà un nom dans la littérature, mais même absent, appelons-le une distribution Plateau avec pdf :F(X)

F(X)=k11+X2unepour XR

où:

  • le paramètre est un entier positif, etune
  • k est une constante d'intégration: k=uneπpéché(π2une)

Voici un tracé du pdf, pour différentes valeurs du paramètre :une

entrez la description de l'image ici

.

Lorsque le paramètre devient grand, la densité tend vers une distribution uniforme (-1,1). Le graphique suivant se compare également à un Normal standard (en pointillés gris):une

entrez la description de l'image ici


3

Un autre ( EDIT : je l'ai simplifié maintenant. EDIT2 : je l'ai encore simplifié, bien que maintenant l'image ne reflète pas vraiment cette équation exacte):

F(X)=13αbûche(matraque(αune)+matraque(αX)matraque(αb)+matraque(αX))

Clunky, je sais, mais ici j'ai profité du fait que s'approche d'une ligne lorsque augmente.xbûche(matraque(X))X

Fondamentalement, vous contrôlez la fluidité de la transition ( ). Si et je garantis que c'est une densité de probabilité valide (somme à 1). Si vous choisissez d'autres valeurs, vous devrez le renormaliser.a = 2 b = 1unelphuneune=2b=1


Voici un exemple de code dans R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fest notre distribution. Tracons-le pour une séquence dex

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Sortie console:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Et l'intrigue:

Ma distribution basée sur log cosh

Vous pouvez changer aet bapproximativement le début et la fin de la pente respectivement, mais une normalisation supplémentaire serait nécessaire, et je ne l'ai pas calculée (c'est pourquoi j'utilise a = 2et b = 1dans l'intrigue).


2

Si vous cherchez quelque chose de très simple, avec un plateau central et les côtés d'une distribution triangulaire, vous pouvez par exemple combiner N distributions triangulaires, N selon le rapport souhaité entre le plateau et la descente. Pourquoi des triangles, car leurs fonctions d'échantillonnage existent déjà dans la plupart des langues. Vous triez au hasard à partir de l'un d'eux.

En R, cela donnerait:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

entrez la description de l'image ici entrez la description de l'image ici


2

En voici une jolie: le produit de deux fonctions logistiques.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Cela a l'avantage de ne pas être fragmentaire.

B ajuste la largeur et A ajuste la pente de la chute. Ci-dessous, B = 1: 6 avec A = 2. Remarque: je n'ai pas pris le temps de comprendre comment normaliser correctement cela.

Distribution des plateaux

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.