CLT avec des variables aléatoires non intégrables

L'exercice 15.5.1 de la «théorie des probabilités: un cours complet» de Klenke se lit comme suit. Trouver une séquence de variables aléatoires réelles indépendantes avec pour tous les telle sorte que Je ne sais pas comment cela est possible si la moyenne n'est même pas définie dans ce cas. Tous les cas que je peux penser à des variables à moyenne non définie ne satisfont pas à un théorème de limite centrale avec une échelle . Toute aide est appréciée. $X_1, X_2, \ldots$ $\mathbb{E}[|X_n|]=\infty$ $n\in \mathbb{N}$

\frac{X_{1} + \dots + X_{n}}{\sqrt{n}} \overset{n \to \infty}{⟹} N (0, 1) .

$\frac{X_1+ \cdots + X_n}{\sqrt{n}} \stackrel{n \to \infty}{\Longrightarrow} N(0,1).$

\sqrt{n}

$\sqrt{n}$

self-study central-limit-theorem

— guest0877
source

Astuce: réduisez les concepts à leurs éléments de base. Puisque le Normal est au cœur du CLT, commencez par le Normal standard . Modifiez-les ensuite pour que (a) chacun ait une valeur absolue attendue infinie tandis que (b) la quantité de modification diminue rapidement avec , de sorte que dans la division limite par "tue" la partie modifiée. Un moyen simple de modifier une variable aléatoire consiste à en ajouter une autre.

X_{i}

$X_i$

n

$n$

\sqrt{n}

$\sqrt{n}$

— whuber

@whuber Voulez-vous dire que les variables aléatoires ne sont pas censées être distribuées de manière identique? S'ils l'étaient, je serais d'accord avec le PO.

— Michael R. Chernick

@whuber La réponse exige également que seul Xn ait la moyenne infinie.

— Michael R. Chernick

Je suppose que le "pour tous les n" signifie que tous les Xi ont une valeur absolue moyenne infinie. J'essaie d'être prudent ici. Je veux comprendre votre indice, mais ne pas dire quelque chose qui révèle la solution du PO.

— Michael R. Chernick

@Michael S'ils étaient iid, le résultat ne serait pas vrai. L'idée est de faire en sorte que la partie de qui fait que l'espérance infinie ait de moins en moins de chances de se produire lorsque augmente. Une bonne façon de le faire est avec un mélange.

X_{n}

$X_n$

n

$n$

— whuber

Parmi les nombreuses façons de résoudre celui-ci, la construction de la séquence en perturbant une variable normale standard semble être la plus simple et la plus élégante.

À la fin, je commente la connexion avec le théorème de limite centrale.

Fonctions caractéristiques

Permettez-moi une digression avant de présenter une solution. L'inspiration pour la technique qui sera utilisée provient de l'idée qu'il ya plus d'une façon de décrire la répartition d'une variable aléatoire . La fonction de distribution est la plus et la plus directe . Une alternative indirecte mais extrêmement utile est sa fonction caractéristique $X$ $F_X(x)=\Pr(X\le x)$

ψ_{X} (t) = E [e^{i t X}] = E [\cos (t X)] + i E [\sin (t X)] .

$\psi_X(t) = E\left[e^{itX}\right] = E\left[\cos(t X)\right] + i\, E\left[\sin(t X)\right].$

Parce que pour tout , est défini pour toute distribution (et ses valeurs pour tout ne peuvent pas dépasser en taille). De plus, et ont la même distribution si et seulement s'ils ont la même fonction caractéristique. Encore mieux est le théorème de continuité de Lévy: une séquence converge en distribution vers une variable aléatoire si et seulement si pour chaque la séquence converge vers une valeur et la fonction $|e^{itX}|=1$ $t$ $\psi_F$ $F$ $t$ $1$ $X$ $Y$ $X_n$ $X$ $t$ $\phi_{X_n}(t)$ $\psi(t)$ $\psi$ est continue à . (Toutes les fonctions caractéristiques sont continues au niveau ). Dans ce cas, est la fonction caractéristique de . $0$ $0$ $\psi$ $X$

Une autre des belles propriétés dont jouissent les fonctions caractéristiques est leur relation avec les combinaisons linéaires: lorsque et sont des variables aléatoires (sur le même espace de probabilité et et sont des nombres réels, $X$ $Y$ $\alpha$ $\beta$

\begin{matrix} (1) & ψ_{α X + β Y} (t) = ψ_{X} (α t) ψ_{Y} (β t) . \end{matrix}

$\psi_{\alpha X+\beta Y}(t) = \psi_X(\alpha t)\psi_Y(\beta t).\tag{1}$

Cela fait des fonctions caractéristiques (cfs) un outil approprié pour étudier les perturbations des variables aléatoires obtenues en y ajoutant de petites quantités d'autres variables aléatoires : c'est-à-dire des variables aléatoires de la forme pourpetit. $X$ $Y$ $X+\beta Y$ $|\beta|$

Solution

Construction d'une séquence

La construction Let une solution en commençant par une variable normale standard et formant une séquence indépendante avec la même distribution que . Cela a évidemment la propriété limite que nous voulons: les moyennes sont toutes normales normales, donc dans la limite la moyenne est normale normale. $Z$ $Z_1, Z_2, \ldots, Z_n, \ldots$ $Z$

Son cf est

\begin{matrix} (2) & ψ_{Z} (t) = e^{- t^{2} / 2} . \end{matrix}

$\psi_Z(t) = e^{-t^2/2}.\tag{2}$

Pour les perturbations, choisissez une variable aléatoire avec une espérance infinie. Il sera pratique pour d'avoir un cf facile à utiliser. Je voudrais suggérer la distribution de Lévy ( alias distribution stable avec ou distribution gamma inverse ) pour laquelle $Y$ $Y$ $\alpha=1/2,\ \beta=1$ $(1/2,1/2)$

ψ_{Y} (t) = e^{- \sqrt{| t |} (1 - i sgn (t))} .

$\psi_Y(t) = e^{-\sqrt{|t|}\,(1 - i \operatorname{sgn}(t))}.$

(Pour , ; pour ) $t\gt 0$ $\operatorname{sgn}(t)=1$ $t \lt 0,$ $\operatorname{sgn}(t)=-1$

Cette distribution est prise en charge sur et n'a pas de moments finis. $(0,\infty)$

Pour cette séquence de variables standard normales , nous allons ajouter toujours plus petits multiples positifs de . $(Z_n)$ $Y$ (La positivité n'est pas nécessaire mais elle facilite le travail avec la fonction .) Soit la séquence de multiples à déterminer. Ainsi, la séquence de variables aléatoires est défini comme où est une séquence iid de variables aléatoires avec la même distribution que . $\operatorname{sgn}$ $p_1,p_2,p_3,\ldots,$

X_{n} = Z_{n} + p_{n} Y_{n}

$X_n=Z_n + p_n Y_n$

(Y_{n})

$(Y_n)$

Y

$Y$

Intuition

Ce dont nous devons nous soucier, c'est de savoir si les perturbations sont si graves qu'elles ruinent la convergence vers une distribution normale standard. Pour ceux qui ont de l'expérience avec de telles distributions à queue lourde, c'est une vraie préoccupation: il y aura toujours une certaine probabilité positive que le petit peu de ajouté dans introduise occasionnellement une si grosse valeur aberrante qu'elle submerge la somme partielle . Toute la raison d'utiliser des fonctions caractéristiques est de démontrer que cela ne se produira pas à long terme, à condition de réduire suffisamment la perturbation (le ). $Y_n$ $Z_n$ $S_n$ $p_n$

Calculs formels

Tout d'abord, a une attente infinie car $X_n$

E [X_{n}] = E [Z_{n} + p_{n} Y_{n}] = E [Z] + p_{n} E [Y] = p_{n} E [Y]

$E[X_n] = E[Z_n + p_n Y_n] = E[Z] + p_n E[Y] = p_n E[Y]$

doit être infini puisque est infini. Ainsi cette séquence satisfait toutes les exigences du problème. $E[Y]$ $(X_n)$

Tournons-nous vers l'analyse des moyennes partielles. Application répétée de à la moyenne partielle $(1)$

S_{n} = \frac{X_{1} + X_{2} + \dots + X_{n}}{\sqrt{n}}

$S_n = \frac{X_1 + X_2 + \cdots + X_n}{\sqrt{n}}$

donne

\begin{matrix} (3) & \begin{aligned} ψ_{S_{n}} (t) & = [e^{- (t / \sqrt{n})^{2} / 2} ψ_{Y} (p_{1} t / \sqrt{n})] \dots [e^{- (t / \sqrt{n})^{2} / 2} ψ_{Y} (p_{n} t / \sqrt{n})] \\ = [e^{- (t / \sqrt{n})^{2} / 2} \dots e^{- (t / \sqrt{n})^{2} / 2}] [ψ_{Y} (p_{1} t / \sqrt{n}) \dots ψ_{Y} (p_{n} t / \sqrt{n})] \\ = e^{- t^{2} / (2 n) - t^{2} / (2 n) - \dots - t^{2} / (2 n)} e^{\sqrt{| p_{1} t / \sqrt{n} |} (- 1 + i sgn (p_{1} t / \sqrt{n})} \dots e^{\sqrt{| p_{n} t / \sqrt{n} |} (- 1 + i sgn (p_{n} t / \sqrt{n})} . \end{aligned} \end{matrix}

$\eqalign{ \psi_{S_n}(t) &= \left[e^{-(t/\sqrt{n})^2/2}\color{Blue}{\psi_Y(p_1 t/\sqrt{n})}\right] \cdots \left[e^{-(t/\sqrt{n})^2/2}\color{Blue}{\psi_Y(p_n t/\sqrt{n})}\right] \\ &= \left[e^{-(t/\sqrt{n})^2/2} \cdots e^{-(t/\sqrt{n})^2/2}\right] \left[\color{Blue}{\psi_Y(p_1t/\sqrt{n}) \cdots \psi_Y(p_nt/\sqrt{n})}\right] \\ &= e^{-t^2/(2n) - t^2/(2n) - \cdots - t^2/(2n)}\quad \color{Blue}{e^{\sqrt{|p_1t/\sqrt{n}|}(-1+i\operatorname{sgn}(p_1t/\sqrt{n})} \cdots e^{\sqrt{|p_nt/\sqrt{n}|}(-1+i\operatorname{sgn}(p_nt/\sqrt{n})} }.\tag{3} }$

La collecte des puissances noires de donne la puissance tandis que la collecte des puissances bleues (provenant des perturbations) donne $e$ $-t^2/2$

\begin{matrix} (4) & \sum_{i = 1}^{n} \sqrt{| p_{i} t / \sqrt{n} |} (- 1 + i sgn (p_{i} t / \sqrt{n})) = \sqrt{| t |} (- 1 + i sgn (t)) \frac{\sum_{i = 1}^{n} \sqrt{p_{i}}}{n^{1 / 4}} \end{matrix}

$\sum_{i=1}^n \color{blue}{\sqrt{|p_it/\sqrt{n}|}(-1+i\operatorname{sgn}(p_it/\sqrt{n}))} = \sqrt{|t|}(-1+i\operatorname{sgn}(t))\frac{\sum_{i=1}^n \sqrt{p_i}}{n^{1/4}}\tag{4}$

car et tous les sont positifs. Depuis , pour tout fixe, la valeur de passe à zéro lorsque augmente à condition queUne façon d'y arriver est de faire converger la somme des : par exemple, . alors $n$ $p_i$ $|-1 + i\operatorname{sgn}(t)| \le \sqrt{2}$ $t$ $(4)$ $n$ $\sum_{i=1}^n\sqrt{p_i} = o(n^{-1/4}).$ $\sqrt{p_i}$ $p_i = 2^{-2i}$

\frac{1}{n^{1 / 4}} \sum_{i = 1}^{n} \sqrt{p_{i}} \leq \frac{1}{n^{1 / 4}} (1 / 2 + 1 / 4 + \dots + 1 / 2^{n} + \dots) = \frac{1}{n^{1 / 4}} \to 0.

$\frac{1}{n^{1/4}} \sum_{i=1}^n \sqrt{p_i} \le \frac{1}{n^{1/4}} (1/2+1/4+\cdots+1/2^n+\cdots) = \frac{1}{n^{1/4}}\to 0.$

Par conséquent, comme l'exponentielle est continue à , les termes bleus convergent vers : ils n'affectent pas la limite. Nous concluons que converge vers . Parce que c'est le cf de la distribution normale standard, le théorème de continuité de Lévy implique que converge vers une distribution normale standard, QED . $0$ $(3)$ $e^0=1$ $(\psi_{S_n})$ $\psi_X$ $S_n$

commentaires

Les idées présentées ici peuvent être généralisées. Nous n'avons pas besoin que le soit Normal normal; il suffit (selon le théorème central limite habituel) qu'ils soient iid avec une moyenne nulle et une variance unitaire. Il semble que nous ayons établi une extension de la CLT: les distributions des moyennes d'une séquence de variables aléatoires indépendantes, même celles avec des attentes et des variances infinies , peuvent (lorsqu'elles sont convenablement normalisées) converger vers une distribution normale standard, à condition que la "partie infinie" des variables aléatoires diminue suffisamment rapidement. $X_n$

— whuber
source