La déclaration classique du théorème central limite (CLT) considère une séquence de variables aléatoires indépendantes, identiquement distribuées avec distribution commune . Cette séquence modélise la situation à laquelle nous sommes confrontés lors de la conception d'un programme ou d'une expérience d'échantillonnage: si nous pouvons obtenir observations indépendantes du même phénomène sous-jacent, alors la collection finie modélise les données anticipées. Permettre à la séquence d'être infinie est un moyen pratique de considérer des tailles d'échantillons arbitrairement grandes.X1,X2,…,Xn,…FnX1,X2,…,Xn
Diverses lois en grand nombre affirment que la moyenne
m(X1,X2,…,Xn)=1n(X1+X2+⋯+Xn)
s'approchera de près de l'espérance de , , avec une probabilité élevée, à condition que ait réellement une espérance. (Toutes les distributions ne le font pas.) Cela implique que l'écart (qui, en fonction de ces variables aléatoires, est également une variable aléatoire) aura tendance à obtenir plus petit lorsque augmente. Le CLT ajoute à cela d'une manière beaucoup plus spécifique: il déclare (sous certaines conditions, que je discuterai ci-dessous) que si nous redimensionnons cet écart par , il aura une fonction de distribution qui se rapproche de quelque zéro- fonction de distribution normale moyenne en tant queFμ(F)Fm(X1,X2,…,Xn)−μ(F)nnn−−√Fnngrandit. (Ma réponse sur https://stats.stackexchange.com/a/3904 tente d'expliquer pourquoi c'est le cas et pourquoi le facteur est le bon à utiliser.)n−−√
Ce n'est pas une déclaration standard du CLT. Connectons-le avec celui habituel. Cette distribution normale limite moyenne nulle sera complètement déterminée par un deuxième paramètre, qui est généralement choisi pour être une mesure de sa propagation (naturellement!), Comme sa variance ou son écart-type. Soit sa variance. Assurément , il doit avoir une certaine relation à une propriété similaire de . Pour découvrir ce que cela pourrait être, laissez avoir une variance - qui pourrait être infinie, soit dit en passant. Quoi qu'il en soit, les étant indépendants, nous calculons facilement la variance des moyennes:σ2FFτ2Xi
Var(m(X1,X2,…,Xn))=Var(1n(X1+X2+⋯+Xn))=(1n)2(Var(X1)+Var(X2)+⋯+Var(Xn))=(1n)2(τ2+τ2+⋯+τ2)=τ2n.
Par conséquent, la variance des résidus standardisés est égale à : elle est constante. La variance de la distribution normale limite doit donc être elle-même. (Cela montre immédiatement que le théorème ne peut tenir que lorsque est fini: c'est l'hypothèse supplémentaire que j'ai passée en revue plus tôt.)τ2/ n × (n--√)2=τ2τ2τ2
(Si nous avions choisi une autre mesure de la propagation de nous pourrions toujours réussir à la connecter à , mais nous n'aurions pas trouvé que la mesure correspondante de la propagation de l'écart moyen normalisé est constante pour tout , qui est une belle - quoique inessentielle - simplification.)Fσ2n
Si nous l'avions souhaité, nous aurions pu uniformiser les écarts moyens tout au long en les divisant par ainsi qu'en les multipliant par . Cela aurait garanti que la distribution limite est normale normale, avec variance unitaire. Que vous choisissiez ou non de standardiser by est vraiment une question de goût: c'est le même théorème et la même conclusion à la fin. Ce qui importait, c'était la multiplication par .τn--√τn--√
Notez que vous pouvez multiplier les écarts par un autre facteur que . Vous pouvez utiliser , ou , ou toute autre chose qui se comporte asymptotiquement comme . Toute autre forme asymptotique réduirait à la limite à ou le ferait exploser à . Cette observation affine notre appréciation du CLT en montrant dans quelle mesure il est flexible quant à la manière dont la normalisation est effectuée. Nous pourrions alors souhaiter énoncer le CLT de la manière suivante.n--√n--√+ exp( - n )n1 / 2 + 1 / nn--√σ20∞
Pourvu que l'écart entre la moyenne d'une séquence de variables IID (avec une distribution commune ) et l'espérance sous-jacente soit mis à l'échelle asymptotiquement par , cet écart mis à l'échelle aura une distribution limite normale moyenne moyenne dont la variance est celle de .Fn--√F
Même si les écarts sont impliqués dans la déclaration, ils apparaissent seulement parce qu'ils sont nécessaires pour caractériser la limitation de la distribution normale et se rapportent sa propagation à celle de . Ce n'est qu'un aspect accessoire. Cela n'a rien à voir avec la variance étant "la meilleure" dans tous les sens. Le nœud du problème est la mise à l'échelle asymptotique par .Fn--√