Parmi les nombreuses façons de résoudre celui-ci, la construction de la séquence en perturbant une variable normale standard semble être la plus simple et la plus élégante.
À la fin, je commente la connexion avec le théorème de limite centrale.
Fonctions caractéristiques
Permettez-moi une digression avant de présenter une solution. L'inspiration pour la technique qui sera utilisée provient de l'idée qu'il ya plus d'une façon de décrire la répartition d'une variable aléatoire . La fonction de distribution est la plus et la plus directe . Une alternative indirecte mais extrêmement utile est sa fonction caractéristiqueX FX( x ) = Pr ( X≤ x )
ψX( t ) = E[ei t X] = E[ cos( t X) ] + iE[ péché( tX) ] .
Parce que pour tout , est défini pour toute distribution (et ses valeurs pour tout ne peuvent pas dépasser en taille). De plus, et ont la même distribution si et seulement s'ils ont la même fonction caractéristique. Encore mieux est le théorème de continuité de Lévy: une séquence converge en distribution vers une variable aléatoire si et seulement si pour chaque la séquence converge vers une valeur et la fonction|ei t X| =1tψFFt1XOuiXnXtϕXn( t )ψ ( t )ψest continue à . (Toutes les fonctions caractéristiques sont continues au niveau ). Dans ce cas, est la fonction caractéristique de .00ψX
Une autre des belles propriétés dont jouissent les fonctions caractéristiques est leur relation avec les combinaisons linéaires: lorsque et sont des variables aléatoires (sur le même espace de probabilité et et sont des nombres réels,XOuiαβ
ψαX+βY(t)=ψX(αt)ψY(βt).(1)
Cela fait des fonctions caractéristiques (cfs) un outil approprié pour étudier les perturbations des variables aléatoires obtenues en y ajoutant de petites quantités d'autres variables aléatoires : c'est-à-dire des variables aléatoires de la forme pourpetit.XYX+βY|β|
Solution
Construction d'une séquence
La construction Let une solution en commençant par une variable normale standard et formant une séquence indépendante avec la même distribution que . Cela a évidemment la propriété limite que nous voulons: les moyennes sont toutes normales normales, donc dans la limite la moyenne est normale normale.ZZ1,Z2,…,Zn,…Z
Son cf est
ψZ(t)=e−t2/2.(2)
Pour les perturbations, choisissez une variable aléatoire avec une espérance infinie. Il sera pratique pour d'avoir un cf facile à utiliser. Je voudrais suggérer la distribution de Lévy ( alias distribution stable avec ou distribution gamma inverse ) pour laquelleYYα=1/2, β=1(1/2,1/2)
ψY(t)=e−|t|√(1−isgn(t)).
(Pour , ; pour )t>0sgn(t)=1t<0, sgn(t)=−1
Cette distribution est prise en charge sur et n'a pas de moments finis.(0,∞)
Pour cette séquence de variables standard normales , nous allons ajouter toujours plus petits multiples positifs de . (Zn)Y(La positivité n'est pas nécessaire mais elle facilite le travail avec la fonction .) Soit la séquence de multiples à déterminer. Ainsi, la séquence de variables aléatoires est défini comme où est une séquence iid de variables aléatoires avec la même distribution que .sgnp1,p2,p3,…,
Xn=Zn+pnYn
(Yn)Y
Intuition
Ce dont nous devons nous soucier, c'est de savoir si les perturbations sont si graves qu'elles ruinent la convergence vers une distribution normale standard. Pour ceux qui ont de l'expérience avec de telles distributions à queue lourde, c'est une vraie préoccupation: il y aura toujours une certaine probabilité positive que le petit peu de ajouté dans introduise occasionnellement une si grosse valeur aberrante qu'elle submerge la somme partielle . Toute la raison d'utiliser des fonctions caractéristiques est de démontrer que cela ne se produira pas à long terme, à condition de réduire suffisamment la perturbation (le ).YnZnSnpn
Calculs formels
Tout d'abord, a une attente infinie carXn
E[Xn]=E[Zn+pnYn]=E[Z]+pnE[Y]=pnE[Y]
doit être infini puisque est infini. Ainsi cette séquence satisfait toutes les exigences du problème.E[Y](Xn)
Tournons-nous vers l'analyse des moyennes partielles. Application répétée de à la moyenne partielle(1)
Sn=X1+X2+⋯+Xnn−−√
donne
ψSn(t)=[e−(t/n√)2/2ψY(p1t/n−−√)]⋯[e−(t/n√)2/2ψY(pnt/n−−√)]=[e−(t/n√)2/2⋯e−(t/n√)2/2][ψY(p1t/n−−√)⋯ψY(pnt/n−−√)]=e−t2/(2n)−t2/(2n)−⋯−t2/(2n)e|p1t/n√|√(−1+isgn(p1t/n√)⋯e|pnt/n√|√(−1+isgn(pnt/n√).(3)
La collecte des puissances noires de donne la puissance tandis que la collecte des puissances bleues (provenant des perturbations) donnee−t2/2
∑i=1n|pit/n−−√|−−−−−−−√(−1+isgn(pit/n−−√))=|t|−−√(−1+isgn(t))∑ni=1pi−−√n1/4(4)
car et tous les sont positifs. Depuis , pour tout fixe, la valeur de passe à zéro lorsque augmente à condition queUne façon d'y arriver est de faire converger la somme des : par exemple, . alorsnpi|−1+isgn(t)|≤2–√t(4)n∑ni=1pi−−√=o(n−1/4).pi−−√pi=2−2i
1n1/4∑i=1npi−−√≤1n1/4(1/2+1/4+⋯+1/2n+⋯)=1n1/4→0.
Par conséquent, comme l'exponentielle est continue à , les termes bleus convergent vers : ils n'affectent pas la limite. Nous concluons que converge vers . Parce que c'est le cf de la distribution normale standard, le théorème de continuité de Lévy implique que converge vers une distribution normale standard, QED .0(3)e0=1(ψSn)ψXSn
commentaires
Les idées présentées ici peuvent être généralisées. Nous n'avons pas besoin que le soit Normal normal; il suffit (selon le théorème central limite habituel) qu'ils soient iid avec une moyenne nulle et une variance unitaire. Il semble que nous ayons établi une extension de la CLT: les distributions des moyennes d'une séquence de variables aléatoires indépendantes, même celles avec des attentes et des variances infinies , peuvent (lorsqu'elles sont convenablement normalisées) converger vers une distribution normale standard, à condition que la "partie infinie" des variables aléatoires diminue suffisamment rapidement.Xn