La distribution normale converge-t-elle vers une distribution uniforme lorsque l'écart-type augmente à l'infini?


18

La distribution normale converge-t-elle vers une certaine distribution si l'écart-type croît sans limites? il me semble que le pdf commence à ressembler à une distribution uniforme avec des bornes données par . Est-ce vrai?[2σ,2σ]


2
Non, mais pour répondre correctement à votre question, nous devons savoir quelle est votre définition de la convergence. Gardez à l'esprit qu'une discussion formelle n'est possible que lorsque le côté droit ne change pas. Vous ne pouvez donc pas établir de convergence vers Unifrom [ ] car votre est en train de changer. Recherchez la formulation de CLT pour voir ce que je veux direσ,σσ
Aksakal

seulement si vous l'enveloppez ou le tronquez à quelque chose . o(σ)
enthdegree

Réponses:


4

Les autres réponses déjà ici font un excellent travail d'expliquer pourquoi VR gaussiennes ne convergent pas vers quoi que ce soit l'augmentation de la variance sans limite, mais je tiens à souligner une propriété en apparence uniforme qu'une telle collection de gaussiennes ne satisfont que je pense pourrait être suffisant pour que quelqu'un devine qu'ils deviennent uniformes, mais cela ne s'avère pas assez fort pour en conclure.

Considérons une collection de variables aléatoires {X1,X2,}XnN(0,n2) . Soit A=[a1,a2] un intervalle fixe de longueur finie, et pour certains cR définissent B=A+c , c'est-à-dire que B est A mais simplement décalé de c . Pour un intervalle I=[i1,i2] définissez len(I)=i2i1 comme étant la longueur de I , et notez que len(A)=len(B) .

Je vais maintenant prouver le résultat suivant:

Résultat : |P(XnA)P(xnB)|0 as n .

J'appelle cela uniforme parce qu'il dit que la distribution de plus en plus deux intervalles fixes de longueur égale ayant une probabilité égale, peu importe à quelle distance ils peuvent être. C'est certainement une fonctionnalité très uniforme, mais comme nous le verrons, cela ne dit rien sur la distribution réelle du convergeant vers une distribution uniforme.X nXnXn

Pf: notez que où donc Je peux utiliser la limite (très approximative) que pour obtenir X 1N ( 0 , 1 ) P ( X nA ) = P ( a 1n X 1a 2 ) = P ( a 1Xn=nX1X1N(0,1)=1

P(XnA)=P(a1nX1a2)=P(a1nX1a2n)
e - x deux / deux1 1
=12πa1/na2/nex2/2dx.
ex2/21= len ( A )
12πa1/na2/nex2/2dx12πa1/na2/n1dx
=len(A)n2π.

Je peux faire la même chose pour pour obtenir B

P(XnB)len(B)n2π.

En les assemblant, j'ai as (j'utilise ici l'inégalité du triangle).

|P(XnA)P(XnB)|2len(A)nπ0
n

En quoi est-ce différent de convergeant sur une distribution uniforme? Je viens de prouver que les probabilités données à tous les deux intervalles fixes de la même longueur finie se rapprochent de plus en plus, et de façon intuitive qui fait sens que les densités sont « aplatissant » de et perspectives d ».XnAB

Mais pour que converge vers une distribution uniforme, il me faudrait pour être proportionnel à pour tout intervalle , et c'est une chose très différente parce que cela doit s'appliquer à tout , pas seulement à un fixe à l'avance (et comme mentionné ailleurs, cela n'est même pas possible pour une distribution avec un support illimité).XnP(XnI)len(I)II


À droite, on pourrait presque dire qu'ils ont convergé dans la distribution, sauf que la limite de ce vers quoi ils convergent est une distribution incorrecte. Un type de convergence qui serait bien défini est que je suppose que vous pourriez montrer que la métrique de Wasserstein approchera de zéro en tant que ? σ
Cliff AB

36

Une erreur courante de probabilité est de penser qu'une distribution est uniforme car elle semble visuellement plate lorsque toutes ses valeurs sont proches de zéro. En effet, nous avons tendance à voir que et pourtant , c'est-à-dire qu'un petit intervalle autour de est 1000 fois plus probable qu'un petit intervalle autour de .f(x)=0.0010.000001=f(y)f(x)/f(y)=0.001/0.000001=1000xy

Ce n'est certainement pas uniforme sur toute la ligne réelle dans la limite, car il n'y a pas de distribution uniforme sur . Ce n'est même pas approximativement uniforme sur .(,)[2σ,2σ]

Vous pouvez voir ce dernier à partir de la règle 68-95-99.7 que vous semblez connaître. S'il était approximativement uniforme sur , alors la probabilité d'être dans et devrait être la même, car les deux intervalles sont les mêmes longueur. Mais ce n'est pas le cas: , mais .[2σ,2σ][0,σ][σ,2σ]P([0,σ])0.68/2=0.34P([σ,2σ])(0.950.68)/2=0.135

Lorsqu'elle est vue sur toute la ligne réelle, cette séquence de distributions normales ne converge vers aucune distribution de probabilité. Il y a plusieurs façons de voir cela. Par exemple, le cdf d'une normale avec un écart-type est , et pour tout , qui n'est le cdf d' aucune variable aléatoire. En fait, ce n'est pas du tout un cdf.σFσ(x)=(1/2)(1+erf(x/2σ)limσFσ(x)=1/2x

La raison de cette non-convergence se résume à une "perte de masse" est la limite. La fonction limite de la distribution normale a en fait "perdu" la probabilité (c'est-à-dire qu'elle s'est échappée à l'infini). Ceci est lié au concept de rigueur des mesures , qui donne les conditions nécessaires pour qu'une séquence de variables aléatoires converge vers une autre variable aléatoire.


1
Le "c'est" incorrect était "toutes ses valeurs sont proches de zéro". Le "C'est" dans "C'est une erreur courante" était correct.
Accumulation

15

Votre déclaration que le pdf commence à ressembler à une distribution uniforme avec des limites données par[2σ,2σ] n'est pas correcte si vous ajustez pour correspondre à l'écart-type plus large.σ

Considérons ce graphique de deux densités normales centrées sur zéro. La courbe rouge correspond à un écart type de et la courbe bleue à un écart type de , et il est en effet vrai que la courbe bleue est quasiment plate sur10 [ - 2 , 2 ]110[2,2]

entrez la description de l'image ici

mais pour la courbe bleue avec , nous devrions en fait regarder sa forme sur . Le redimensionnement à la fois de l' axe et de l'axe par des facteurs de donne ce graphique suivant, et vous obtenez exactement la même forme pour la densité bleue dans ce graphique ultérieur que la densité rouge dans le graphique précédent [ - 20 , 20 ] x y 10σ=10[20,20]xy10

entrez la description de l'image ici


2

Votre question est fondamentalement erronée. La distribution normale standard est mise à l'échelle de sorte que . Donc, pour une autre distribution gaussienne ( ), la courbe entre les bornes a la même forme que la distribution normale standard. La seule différence est le facteur d'échelle. Donc, si vous redimensionnez le gaussien en divisant par , vous vous retrouvez avec la distribution normale standard.σ=1μ=0,σ=σ[2σ,2σ]σ

Maintenant, si vous avez une distribution gaussienne ( ) alors oui comme , la région entre devient plus plate.σ [ - 2 , 2 ]μ=0,σ=σσ[2,2]

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.