Comment fonctionne l'erreur standard?


17

J'ai récemment étudié le fonctionnement interne de l'erreur standard et je me suis trouvé incapable de comprendre comment cela fonctionne. D'après ce que je comprends de l'erreur type, il s'agit de l'écart type de la distribution des moyennes des échantillons. Mes questions sont:

• comment savons-nous que l'erreur-type est l'écart-type des moyennes de l'échantillon alors que nous ne prenons habituellement qu'un seul échantillon?

• pourquoi l'équation pour calculer l'erreur standard ne reflète-t-elle pas l'équation de l'écart type pour un seul échantillon?


Lorsque vous dites «échantillon unique», voulez-vous dire un ensemble d'échantillons ou vraiment une taille d'échantillon de 1?
Erik

1
Ceux-ci sont expliqués pour un problème simple mais intéressant (une réponse ternaire) dans un langage simple et non statistique sur stats.stackexchange.com/a/18609 .
whuber

Réponses:


13

Oui, l'erreur type de la moyenne (SEM) est l'écart type (SD) des moyennes. (L'erreur standard est une autre façon de dire SD d'une distribution d'échantillonnage. Dans ce cas, la distribution d'échantillonnage est la moyenne pour des échantillons de taille fixe, disons N.) Il existe une relation mathématique entre le SEM et la population SD: SEM = population SD / la racine carrée de N. Cette relation mathématique est très utile, car nous n'avons presque jamais d'estimation directe du SEM mais nous avons une estimation de la population SD (à savoir la SD de notre échantillon). Quant à votre deuxième question, si vous deviez collecter plusieurs échantillons de taille N et calculer la moyenne de chaque échantillon, vous pourriez estimer le SEM simplement en calculant la SD des moyennes. Ainsi, la formule pour SEM reflète bien la formule pour la SD d'un seul échantillon.


13

Supposons que sont indépendants et identiques. C'est la situation à laquelle je suis presque sûr de faire référence. Soit leur moyenne commune μ et leur variance commune σ 2 .X1,X2,,Xnμσ2

Maintenant, la moyenne de l'échantillon est . La linéarité de l'espérance montre que la moyenne de X b est également μ . L'hypothèse d'indépendance implique que la variance de X b est la somme des variances de ses termes. Chacun de ces termes X i / n a une variance σ 2 / n 2 (parce que la variance d'une constante fois une variable aléatoire est la constante au carré multipliée par la variance de la variable aléatoire). Nous avons nXb=iXi/nXbμXbXi/nσ2/n2nréparties de manière identique pour additionner ces variables, de sorte que chaque terme a la même variance. Par conséquent, nous obtenons pour la variance de la moyenne de l'échantillon.nσ2/n2=σ2/n

Habituellement, nous ne connaissons pas et nous devons donc l'estimer à partir des données. Selon le paramètre, il existe différentes manières de procéder. Les deux estimations à usage général les plus courantes de σ 2 sont la variance de l' échantillon s 2 = 1σ2σ2 et un petit multiple de celui-ci,s 2 u =ns2=1ni(XiXb)2(qui est un estimateur sans biais deσ2). L'utilisation de l'un de ces deux à la place deσ2dans le paragraphe précédent et la prise de la racine carrée donne l'erreur standard sous la forme des/su2=nn1s2σ2σ2 ousu/s/n .su/n


1
C'est très bien. Avez-vous des suggestions de livres ou de lectures pour développer des compétences similaires. Merci.
q126y le

Réponse élégante!
Jinhua Wang

7

σx¯2=σpop2nj,
where σpop2 is the population variance, and nj is the number of groups. Although we don't usually perform the calculations in this way, we could simply use standard formulas to plug in estimated values, and with minimal algebraic reshuffling, form the F statistic like so:
F=nj×sx¯2spooled within group2
In this case, we really would be using the standard formula (only applied over the group means), that is:
sx¯2=j=1nj(x¯jx¯.)2nj1,
with x. being the mean of the group means.

In that we typically believe the null hypothesis is not true, @JoelW.'s point is right, but I work through this point, because I think the clarity it affords is helpful for understanding these issues.


2
I think your comment is basically the same as this one, which was written with less mathematical notation: stats.stackexchange.com/questions/32206/…
Joel W.
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.