Belle question (+1) !!
Vous vous souviendrez que pour les variables aléatoires indépendantes X et Y , Var(X+Y)=Var(X)+Var(Y) et Var(a⋅X)=a2⋅Var(X) . Donc la variance de ∑ni=1Xi est ∑ni=1σ2=nσ2 , et la variance de X¯=1n∑ni=1Xi est nσ2/n2=σ2/n .
Ceci est pour la variance . Pour normaliser une variable aléatoire, vous la divisez par son écart-type. Comme vous le savez, la valeur attendue de est , donc la variable μX¯μ
N(0,
X¯−E(X¯)Var(X¯)−−−−−−√=n−−√X¯−μσ
a la valeur attendue 0 et la variance 1. Donc, si elle tend à être gaussienne, il doit s'agir du gaussien standard . Votre formulation dans la première équation est équivalente. En multipliant le côté gauche par vous définissez la variance sur .
σ σ 2N(0,1)σσ2
En ce qui concerne votre deuxième point, je pense que l’équation présentée ci-dessus montre que vous devez diviser par et non pas pour standardiser l’équation, en expliquant pourquoi vous utilisez (l’estimateur de et non .√σ snσ) √σ−−√snσ)sn−−√
Ajout: @whuber suggère de discuter du pourquoi de la mise à l'échelle par . Il le fait là- bas , mais comme la réponse est très longue, je vais essayer de saisir l'essentiel de son argument (qui est une reconstruction des pensées de de Moivre).n−−√
Si vous ajoutez un grand nombre de +1 et de -1, vous pouvez approximer la probabilité que la somme soit par comptage élémentaire. Le log de cette probabilité est proportionnel à . Donc, si nous voulons que la probabilité ci-dessus converge vers une constante lorsque augmente, nous devons utiliser un facteur de normalisation dans .j - j 2 / n n O ( √nj−j2/nnO(n−−√)
En utilisant des outils mathématiques modernes (post de Moivre), vous pouvez voir l’approximation mentionnée ci-dessus en remarquant que la probabilité recherchée est:
P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2−j)!
que nous approchons par la formule de Stirling
P(j)≈nnen/2+jen/2−j2nen(n/2+j)n/2+j(n/2−j)n/2−j=(11+2j/n)n+j(11−2j/n)n−j.
log(P(j))=−(n+j)log(1+2j/n)−(n−j)log(1−2j/n)∼−2j(n+j)/n+2j(n−j)/n∝−j2/n.