Il peut être instructif de démontrer ce résultat à partir des premiers principes et des résultats de base , en exploitant les propriétés des fonctions générant des cumulants (exactement comme dans les preuves standard du théorème central limite). Il nous faut comprendre le taux de croissance des nombres harmoniques généralisés pour Ces taux de croissance sont bien connus et facilement obtenus par comparaison avec les intégrales : ils convergent pour et divergent autrement logarithmiquement pour . s = 1 , 2 , … . ∫ n 1 x - s d x s > 1 s = 1
H(n,s)=∑k=1nk−s
s=1,2,….∫n1x−sdxs>1s=1
Soit et . Par définition, la fonction de génération de cumul (cgf) de est1 ≤ k ≤ n ( X k - 1 / k ) / B nn≥21≤k≤n(Xk−1/k)/Bn
ψk,n(t)=logE(exp(Xk−1/kBnt))=−tkBn+log(1+−1+exp(t/Bn)k).
L'expansion en série du côté droit, obtenue à partir de l'expansion de autour de , prend la formez = 0log(1+z)z=0
ψk,n(t)=(k−1)2k2B2nt2+k2−3k+26k3B3nt3+⋯+kj−1−⋯±(j−1)!j!kjBjntj+⋯.
Les numérateurs des fractions sont des polynômes en avec le terme principal . Parce que l'expansion du journal converge absolument pour , cette expansion converge absolument lorsquek j - 1 | - 1 + exp ( t / B n )kkj−1∣∣−1+exp(t/Bn)k∣∣<1
|exp(t/Bn)−1|<k.
(Dans le cas où il converge partout.) Pour fixe et les valeurs croissantes de , la divergence (évidente) de implique que le domaine de convergence absolue devient arbitrairement grand. Ainsi, pour tout fixe et suffisamment grand , cette expansion converge absolument.k n B n t nk=1knBntn
Pour suffisamment grand , on peut donc additionner l'individu sur terme par terme en puissances de pour obtenir le cgf de ,ψ k , n k t S n / B nnψk,nktSn/Bn
ψn(t)=∑k=1nψk,n(t)=12t2+⋯+1Bjn(∑k=1n(k−1−⋯±(j−1)!k−j))tjj+⋯.
Prendre les termes dans les sommes sur un à la fois nous oblige à évaluer les expressions proportionnelles àk
b(s,j)=1Bjn∑k=1nk−s
pour et . En utilisant l'asymptotique des nombres harmoniques généralisés mentionnés dans l'introduction, il découle facilement dej≥3s=1,2,…,j
B2n=H(n,1)−H(n,2)∼log(n)
cette
b(1,j)∼(log(n))1−j/2→0
et (pour )s>1
b(s,j)∼(log(n))−j/2→0
à mesure que grandit. Par conséquent, tous les termes dans l'expansion de au-delà de convergent vers zéro, d'où converge vers pour toute valeur de . Puisque la convergence du cgf implique la convergence de la fonction caractéristique, nous concluons du théorème de continuité de Levy que rapproche d'une variable aléatoire dont le cgf est 2/2 : c'est la variable normale standard, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2
Cette analyse révèle à quel point la convergence est délicate: alors que dans de nombreuses versions du théorème de la limite centrale, le coefficient de est (pour ), ici le coefficient est seulement : la convergence est beaucoup plus lente. En ce sens la séquence de variables standardisées "à peine" devient Normale.tjO(n1−j/2)j≥3O(((log(n))1−j/2)
Nous pouvons voir cette lente convergence dans une série de simulations. Les histogrammes affichent itérations indépendantes pour quatre valeurs de . Les courbes rouges sont des graphiques des fonctions de densité normale standard pour référence visuelle. Bien qu'il y ait évidemment une tendance graduelle à la normalité, même à (où est encore appréciable), il reste une non-normalité appréciable, comme en témoigne l'asymétrie (égal à dans cet échantillon). (Il n'est pas surprenant que l'asymétrie de cet histogramme soit proche de , car c'est précisément ce que le terme dans le cgf est.)105nn=1000(log(n))−1/2≈0.380.35(log(n))−1/2t3
Voici le R
code pour ceux qui souhaitent expérimenter davantage.
set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
z <- colSums(x - 1/(1:n)) / B.n
hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}