Par définition, la variance est calculée en prenant la somme des différences au carré de la moyenne et en la divisant par la taille. Nous avons la formule générale
oùμest la moyenne etNla taille de la population.σ2= ΣNje( Xje- μ )2NμN
Selon cette définition, la variance d'un échantillon (par exemple, l'échantillon ) doit également être calculée de cette manière.t
où ¯ X est la moyenne etnla taille de ce petit échantillon.σ2t= Σnje( Xje- X¯¯¯¯¯)2nX¯¯¯¯n
Cependant, par variance d'échantillon , nous entendons un estimateur de la variance de population σ 2 . Comment pouvons-nous estimer σ 2 uniquement en utilisant les valeurs de l'échantillon?S2σ2σ2
Selon les formules ci-dessus, la variable aléatoire s'écarte de la moyenne de l'échantillon ¯ X avec la variance σ 2 t . La moyenne de l'échantillon ¯ X s'écarte également de µ avec la variance σ 2XX¯¯¯¯σ2tX¯¯¯¯μ parce que la moyenne de l'échantillon obtient des valeurs différentes d'un échantillon à l'autre et qu'il s'agit d'une variable aléatoire avec la moyenneµet la varianceσ2σ2nμ . (On peut prouver facilement.)σ2n
Par conséquent, approximativement, devrait s'écarter de μ avec une variance impliquant deux variances, donc additionnez-les et obtenez σ 2 = σ 2 t + σ 2Xμ . En résolvant ceci, nous obtenonsσ2=σ 2 t ×nσ2=σ2t+σ2n . Remplacerσ 2 t donne notre estimateur pour la variance de population:σ2=σ2t×nn−1σ2t
.S2=∑ni(Xi−X¯¯¯¯¯)2n−1
On peut aussi prouver que est vrai.E[S2]=σ2