Pourquoi le CLT ne fonctionne-t-il pas pour

Nous savons donc qu'une somme de poissons avec le paramètre est elle-même un poisson avec . Donc, hypothétiquement, on pourrait prendre et dire que c'est en fait où chaque est: $n$ $\lambda$ $n\lambda$ $x \sim poisson(\lambda = 1)$ $\sum_1^n x_i \sim poisson(\lambda = 1)$ $x_i$ $x_i \sim poisson(\lambda = 1/n)$ et prenez un grand n pour que CLT fonctionne.

Cela (évidemment) ne fonctionne pas. Je suppose que cela a quelque chose à voir avec la façon dont CLT fonctionne "plus rapidement" pour les variables aléatoires qui sont "plus proches" de la normale, et que plus le lambda est petit, plus nous obtenons une variable aléatoire qui est principalement de 0 et varie rarement autre chose.

Cependant, ce que j'ai expliqué, c'est mon intuition. Existe-t-il un moyen plus formel d'expliquer pourquoi c'est le cas?

Merci!

poisson-distribution central-limit-theorem asymptotics

— Tal Galili
source

Pour commencer, CLT a besoin que vous divisiez

\sum_{i = 1}^{n} x_{i}

$\sum_{i=1}^nx_i$ par

\sqrt{n}

$\sqrt{n}$ (auquel cas vous obtiendrez converger vers un gaussien).

— Alex R.

@AlexR. Non, vous divisez par

n

$n$ , alors l'écart-type sera un facteur de

1 / \sqrt{n}

$1/\sqrt n$

— Aksakal

Je ne vois pas ce que cette question a à voir avec le CLT "ne fonctionne pas". Le CLT concerne des sommes standardisées de variables aléatoires avec une distribution donnée , alors que vous prenez une seule variable aléatoire et envisagez une infinité de façons de la diviser .

— whuber

@AlexR La configuration semble incorrecte. Il y a deux processus différents en cours ici - sommation et division - et il n'y a aucune raison de supposer qu'ils devraient avoir des caractéristiques asymptotiques similaires.

— whuber

@Aksakal: en fait, AlexR a raison. Si vous divisez par

, vous obtenez une distribution dégénérée comme

. Si vous divisez par

n

$n$

n \to \infty

$n \rightarrow \infty$

, vous approchez d'une distribution normale avec sd = 1 comme

\sqrt{n}

$\sqrt n$

n \to \infty

$n \rightarrow \infty$

— Cliff AB

Réponses:

Je suis d'accord avec @whuber que la racine de la confusion semble remplacer l'asymptotique de sommation en CLT par une sorte de division dans votre argument. En CLT on obtient le fixe la distribution puis tracer nombres de celle - ci , et calculer la somme $f(x,\lambda)$ $n$ $x_i$ . Si nous continuons à augmenterune chose intéressante se produit: $\bar x_n=\frac{1}{n}\sum_{i=1}^nx_i$ $n$ oùsont la moyenne et la variance de la distribution.

\sqrt{n} ({\bar{x}}_{n} - μ) \to N (0, σ^{2})

$\sqrt n (\bar x_n-\mu)\rightarrow\mathcal{N}(0,\sigma^2)$

μ, σ^{2}

$\mu,\sigma^2$

f (x)

$f(x)$

Ce que vous proposez de faire avec Poisson est un peu à l'envers: au lieu de sommer les variables d'une distribution fixe , vous voulez diviser la distribution fixe en parties en constante évolution . En d'autres termes, vous prenez une variable d'une distribution fixe puis la divisez en sorte que $x$ $f(x,\lambda)$ $x_i$

\sum_{i = 1}^{n} x_{i} \equiv x

$\sum_{i=1}^nx_i\equiv x$

Que dit CLT de ce processus? Rien. Remarque, comment dans CLT nous avons jamais changé , et sadistributionchangeantequi converge vers unedistributionfixe $\sqrt n(\bar x_n-\mu)$ $f_n(x)$ $\mathcal{N}(0,\sigma^2)$

Dans votre configuration, ni la somme ni sa distribution ne changent! Ils sont fixes. Ils ne changent pas, ils ne convergent vers rien. Donc, CLT n'a rien à dire à leur sujet. $x$ $f(x,\lambda)$

De plus, CLT ne dit rien sur le nombre d'éléments dans la somme. Vous pouvez avoir une somme de 1000 variables de Poisson (0,001) et CLT ne dira rien sur la somme. Tout ce qu'il dit, c'est que si vous continuez à augmenter N, cette somme commencera à un moment donné à ressembler à une distribution normale . En fait, si N = 1 000 000, vous obtiendrez une approximation proche de la distribution normale. $\frac{1}{N}\sum_{i=1}^N x_i, x_i\sim Poisson(0.001)$

Votre intuition ne concerne que le nombre d'éléments dans la somme, c'est-à-dire que plus la distribution de départ est différente de la normale, plus vous devez additionner d'éléments pour arriver à la normale. La façon plus formelle (mais toujours informelle) serait en regardant la fonction caractéristique de Poisson: Si vous , vous obtenez avec l'expansion Taylor (WRT ) de l'exposant imbriqué:

\exp (λ (\exp (i t) - 1))

$\exp(\lambda (\exp(it)-1))$

λ >> 1

$\lambda>>1$

t

$t$

C'est la fonction caractéristique de la distribution normale

\approx \exp (i λ t - λ / 2 t^{2})

$\approx\exp(i\lambda t-\lambda/2t^2)$

N (λ, λ^{2})

$\mathcal{N}(\lambda,\lambda^2)$

Cependant, votre intuition n'est pas appliquée correctement: votre déplacement de la somme dans CLT avec une sorte de division gâche les choses et rend CLT inapplicable.

— Aksakal
source

+1 Le matériel préparatoire est joliment rédigé, très clair et va au cœur du problème.

— whuber

Le problème avec votre exemple est que vous autorisez les paramètres à changer lorsque change. Le CLT vous dit que pour une distribution fixe avec une moyenne finie et sd, comme , $n$ $n \rightarrow \infty$

, $\frac {\sum x - \mu} {\sqrt n} \rightarrow_d N(0, \sigma)$

où et sont issus de la moyenne et sd de la distribution de . $\mu$ $\sigma$ $x$

Bien sûr, pour différentes distributions (c'est-à-dire plus asymétriques par exemple), des plus grands sont nécessaires avant que l'approximation dérivée de ce théorème ne devienne raisonnable. Dans votre exemple, pour , un est nécessaire avant que l'approximation normale est raisonnable. $n$ $\lambda_m = 1/m$ $n >> m$

ÉDITER

Il y a une discussion sur la façon dont le CLT ne s'applique pas aux sommes, mais plutôt aux sommes standardisées (c'est-à-dire pas). En théorie, cela est bien sûr vrai: la somme non standardisée aura une distribution non définie dans la plupart des cas. $\sum x_i / \sqrt n$ $\sum x_i$

$F_{\bar x}$ $n$ $F_{\sum x}$ $X_i \sim Pois(\lambda)$ $Y = \sum_{i = 1}^n X_i \sim Pois(n\lambda)$ $\lambda$ $Pois(\lambda)$ can be approximated quite well by a normal with $\mu = \lambda$ , $\sigma^2 = \lambda$ . So for any fixed $\lambda$ , we can approximate the CDF of $Y \sim Pois(n\lambda)$ fairly well with $\Phi( \frac{y - n\lambda}{\sqrt{n\lambda} })$ for a large enough $n$ if $\lambda > 0$ (approximation can trivially be applied if $\lambda = 0$ , but not the calculation of the CDF as I have written it).

While the CLT does not readily apply to sums, the approximation based on the CLT certainly does. I believe this is what the OP was referring to when discussing applying the CLT to the sum.

— Cliff AB
source

The question is, I argue, more interesting if thought about more generally, letting the distribution of the parent Poisson depend on $n$ , say with parameter $\lambda_n$ and $\lambda_n = 1$ as a special case. I think it's perfectly reasonable to ask why, and how we can understand that, a central limit theorem does not hold for the sum $S_n = \sum_{i=1}^n X_{i,n}$ . After all, it's common to apply a CLT even in problems where the distributions of the components of the sum depend on $n$ . It's also common to decompose Poisson distributions as the distribution of a sum of Poisson variables, and then apply a CLT.

The key issue as I see it is that your construction implies the distribution of $X_{i, n}$ depends on $n$ in such a way that the parameter of the distribution of $S_n$ does not grow in $n$ . If you would instead have taken, for example, $S_n \sim Poi(n)$ and made the same decomposition, the standard CLT would apply. In fact, one can think of many decompositions of a $Poi(\lambda_n)$ distribution that allows for application of a CLT.

The Lindeberg-Feller Central Limit Theorem for triangular arrays is often used to examine convergence of such sums. As you point out, $S_n \sim Poi(1)$ for all $n$ , so $S_n$ cannot be asymptotically normal. Still, examining the Lindeberg-Feller condition sheds some light on when decomposing a Poisson into a sum may lead to progress.

A version of the theorem may be found in these notes by Hunter. Let $s_n^2 = \mathrm{Var(S_n)}$ . The Lindeberg-Feller condition is that, $\forall \epsilon >0$ :

\frac{1}{s_{n}^{2}} \sum_{i = 1}^{n} E [X_{i, n} - 1 / n]^{2} I (| X_{i, n} - 1 / n | > ϵ s_{n}) \to 0, n \to \infty

$\frac{1}{s_n^2}\sum_{i=1}^n\mathbb E[X_{i,n} - 1/n]^2I(\vert X_{i,n} - 1/n \vert >\epsilon s_n) \to 0,n\to\infty$

Now, for the case at hand, the variance of the terms in the sum is dying off so quickly in $n$ that $s_n = 1$ for every $n$ . For fixed $n$ , we also have that the $X_{i,n}$ are iid. Thus, the condition is equivalent to

n E [X_{1, n} - 1 / n]^{2} I (| X_{1, n} - 1 / n | > ϵ) \to 0.

$n\mathbb E[X_{1,n} - 1/n]^2I(\vert X_{1,n} - 1/n \vert >\epsilon) \to 0.$

But, for small $\epsilon$ and large $n$ ,

\begin{aligned} n E [X_{1, n} - 1 / n]^{2} I (| X_{1, n} - 1 / n | > ϵ) & > n ϵ^{2} P (X_{1, n} > 0) \\ = ϵ^{2} n [1 - e^{- 1 / n}] \\ = ϵ^{2} n [1 - (1 - 1 / n + o (1 / n))] \\ = ϵ^{2} + o (1), \end{aligned}

$\begin{align} n\mathbb E[X_{1,n} - 1/n]^2I(\vert X_{1,n} - 1/n \vert >\epsilon) &>n\epsilon^2P(X_{1,n}>0) \\ &=\epsilon^2n[1 - e^{-1/n}] \\ &= \epsilon^2n[1-(1 - 1/n + o(1/n))] \\ &= \epsilon^2 + o(1), \end{align}$

which does not approach zero. Thus, the condition fails to hold. Again, this is as expected since we already know the exact distribution of $S_n$ for every $n$ , but going through these calculations gives some indications of why it fails: if the variance didn't die off as quickly in $n$ you could have the condition hold.

— ekvall
source

+1 This nicely illuminates a comment by @AlexR to the question, too.

— whuber