Si vous définissez la variance comme - similaire à la variance de la population mais avec une moyenne d'échantillon pour , vos deux échantillons auraient alors la même variance.s2n=MSE= 1n∑ni = 1( xje- x¯)2μ
La différence est donc uniquement due à la correction de Bessel dans la formule habituelle de la variance de l'échantillon ( , qui ajuste le fait que la moyenne de l' échantillon est plus proche des données que la moyenne de la population, afin de la rendre non biaisée (en prenant la bonne valeur "en moyenne").s2n - 1= nn - 1⋅ MSE = nn - 1⋅ 1n∑ni = 1( xje- x¯)2= 1n - 1∑ni = 1( xje- x¯)2
L'effet disparaît progressivement avec l'augmentation de la taille de l'échantillon, car passe à 1 en tant que .n - 1nn → ∞
Il n'y a aucune raison particulière que vous ayez à utiliser l'estimateur sans biais pour la variance, soit dit en passant - est un estimateur parfaitement valide, et dans certains cas peut sans doute avoir des avantages par rapport à la forme la plus courante (l'impartialité n'est pas nécessairement un grand traiter).s2n
La variance elle-même n'est pas directement une mesure de l'écart. Si je double toutes les valeurs de mon ensemble de données, je prétends qu'elles sont deux fois plus «étalées». Mais la variance augmente d'un facteur 4. Donc, le plus souvent, on dit que l'écart-type, plutôt que la variance, est une mesure de l'écart.
sn - 1
Dans les petits échantillons, la correction de Bessel rend l'écart-type un peu moins intuitif comme mesure de l'écart en raison de cet effet (la duplication de l'échantillon modifie la valeur). Mais de nombreuses mesures de l'écart conservent la même valeur lors de la duplication de l'échantillon; J'en mentionnerai quelques-uns -
sn
l'écart moyen (absolu) par rapport à la moyenne
l'écart médian (absolu) par rapport à la médiane
l'intervalle interquartile (au moins pour certaines définitions des quartiles d'échantillonnage)
{3, 5}
soi est de 1, selon la première formule. Comme vous l'avez souligné, le questionneur a tenté d'estimer la variance d'une population dont il est présumé qu'il s'agit d'un échantillon, mais qui sait si c'est le cas ou non.