Ce que vous voulez trouver, c'est l'écart-type de la distribution d'échantillonnage de la moyenne. C'est-à-dire, dans un langage simple, la distribution d'échantillonnage est lorsque vous choisissez éléments de votre population, les additionnez et divisez la somme par . Nous trouvons ensuite la variance de cette quantité et obtenons l'écart type en prenant la racine carrée de sa variance.nnn
Donc, que les éléments que vous choisissez soient représentés par les variables aléatoires , chacune étant identiquement distribuée avec la variance . Ils sont échantillonnés indépendamment, donc la variance de la somme n'est que la somme des variances.
σ 2 Var ( n ∑ i = 1 X i ) = n ∑ i = 1 Var ( X i ) = n ∑ i = 1 σ 2 = n σ 2Xje, 1 ≤ i ≤ nσ2
Var ( ∑i = 1nXje) = ∑i = 1nVar ( Xje) = ∑i = 1nσ2= n σ2
Ensuite, nous divisons par . Nous savons en général que , donc en mettant nous avonsVar ( k Y ) = k 2 Var ( Y ) k = 1 / nnVar ( k Y) = k2Var ( Y)k = 1 / n
Var ( ∑ni = 1Xjen) = 1n2Var ( ∑i = 1nXje) = 1n2n σ2= σ2n
Enfin, prenez la racine carrée pour obtenir l'écart type . Lorsque l'écart-type de population n'est pas disponible, l'écart-type d'échantillon est utilisé comme estimation, donnant . ssσn--√ssn--√
Tout ce qui précède est vrai quelle que soit la distribution des , mais cela soulève la question de ce que vous voulez réellement faire avec l'erreur standard? En règle générale, vous souhaiterez peut-être construire des intervalles de confiance, et il est ensuite important d'attribuer une probabilité à la construction d'un intervalle de confiance qui contient la moyenne.Xje
Si vos sont normalement distribués, c'est facile, car alors la distribution d'échantillonnage est également normalement distribuée. Vous pouvez dire que 68% des échantillons de la moyenne se situeront à moins d'une erreur standard de la vraie moyenne, 95% seront à moins de 2 erreurs standard, etc.Xje
Si vous avez un échantillon suffisamment grand (ou un échantillon plus petit et que les ne sont pas trop anormaux), vous pouvez invoquer le théorème de la limite centrale et dire que la distribution d'échantillonnage est distribuée approximativement normalement, et vos énoncés de probabilité sont également approximatifs.Xje
Un exemple typique est l'estimation d'une proportion , où vous tirez éléments chacun d'une distribution de Bernouilli. La variance de chaque distribution est et donc l'erreur standard est (la proportion est estimée à l'aide des données). Pour ensuite dire qu'environ quelque% des échantillons se situent à l'intérieur de tant d'écarts-types de la moyenne, vous devez comprendre quand la distribution d'échantillonnage est approximativement normale. L'échantillonnage répété à partir d'une distribution de Bernouilli est identique à l'échantillonnage à partir d'une distribution binomiale, et une règle de base courante consiste à se rapprocher uniquement lorsque et sontn X i p ( 1 - p ) √pnXjep ( 1 - p ) pnpn(1-p)≥5p ( 1 - p ) / n---------√pnpn(1−p)≥5. (Voir wikipedia pour une discussion plus approfondie sur l'approximation du binôme avec la normale. Voir ici pour un exemple pratique d'erreurs standard avec une proportion.)
Si, d'autre part, votre distribution d'échantillonnage ne peut pas être approximée par une distribution normale, alors l'erreur standard est beaucoup moins utile. Par exemple, avec une distribution asymétrique très asymétrique, vous ne pouvez pas dire que le même% d'échantillons serait un écart type chaque côté de la moyenne, et vous voudrez peut-être trouver une manière différente d'associer les probabilités aux échantillons.±1