Est-il possible de trouver l'écart type combiné?


Réponses:


30

Donc, si vous souhaitez simplement réunir deux de ces échantillons, vous avez:

s1=1n1Σi=1n1(xiy¯1)2

s2=1n2Σi=1n2(yiy¯2)2

où et sont des exemples de moyennes et et sont des exemples d'écarts-types. ˉ y 2s1s2y¯1y¯2s1s2

Pour les additionner vous avez:

s=1n1+n2Σje=1n1+n2(zje-y¯)2

ce qui n’est pas si simple puisque la nouvelle moyenne est différente de et \ bar {y} _2 :ˉ y 1 ˉ y 2y¯y¯1y¯2

y¯=1n1+n2Σje=1n1+n2zje=n1y¯1+n2y¯2n1+n2

La formule finale est la suivante:

s=n1s12+n2s22+n1(y¯1-y¯)2+n2(y¯2-y¯)2n1+n2

Pour la version de l'écart type généralement corrigée par Bessel (" dénominateur "), les résultats pour les moyennes sont les mêmes que précédemment, maisn-1

s=(n1-1)s12+(n2-1)s22+n1(y¯1-y¯)2+n2(y¯2-y¯)2n1+n2-1

Vous pouvez lire plus d'informations ici: http://en.wikipedia.org/wiki/Standard_deviation


1
Si le PO utilise la version de l'écart type de l'échantillon corrigée par Bessel ( dénominateur pour la variance) (comme le feront presque tous ceux qui le demandent ici), cette réponse ne leur donnera pas tout à fait ce qu'ils recherchent. n-1
Glen_b -Reinstate Monica

Dans ce cas, cette section fait l'affaire. (éditer pour faire un lien vers l'ancienne version de wikipedia puisqu'elle a été retirée de la nouvelle)
Glen_b -Reinstate Monica

@Glen_b Bonne prise. Pouvez-vous modifier ceci dans la réponse pour le rendre plus utile alors?
Sashkello

Je suis allé sur Wikipedia pour trouver la preuve, mais malheureusement cette formule n’est plus là. Vous souhaitez élaborer (la preuve) ou améliorer Wikipedia? :)
Rauni Lillemets


8

Cela s'étend évidemment aux groupes :K

s=k=1K(nk1)sk2+nk(y¯ky¯)2(k=1Knk)1

7
C'est un peu bref par rapport aux normes. Pourriez-vous en dire un peu plus sur la façon dont cela est dérivé et pourquoi c'est la bonne réponse?
Sycorax dit de réintégrer Monica le

1

J'ai eu le même problème: avoir l'écart-type, les moyennes et les tailles de plusieurs sous-ensembles avec une intersection vide, calculez l'écart-type de l'union de ces sous-ensembles.

J'aime la réponse de sashkello et Glen_b ♦ , mais je voulais en trouver une preuve. Je l'ai fait de cette façon et je le laisse ici au cas où cela pourrait aider quelqu'un.


L’objectif est donc de voir que:

s=(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2

Pas à pas:

(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1(xiy1¯)2+i=1n2(yiy2¯)2+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1((xiy1¯)2+(y¯1y¯)2)+i=1n2((yiy2¯)2+(y¯2y¯)2)n1+n2)1/2=(i=1n1(xi2+y¯2+2y1¯22xiy1¯2y1¯y¯)n1+n2+i=1n2(yi2+y¯2+2y2¯22yiy2¯2y2¯y¯)n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯i=1n1xin1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯i=1n2yin1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯n1y1¯n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯n2y2¯n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)n1+n2)1/2

Maintenant, l’astuce consiste à réaliser que nous pouvons réorganiser les sommes: étant donné que chaque terme terme apparaît fois, nous pouvons écrivez le numérateur sous la forme

2y¯j=1n1xjn1
n1
i=1n1(xi2+y¯22y¯xi),

et par conséquent, continuons avec la chaîne d'égalité:

=(i=1n1(xiy¯)2n1+n2+i=1n2(yiy¯)2n1+n2)1/2=(i=1n1+n2(ziy¯)2n1+n2)1/2=s

Cela dit, il existe probablement un moyen plus simple de procéder.

La formule peut être étendue à sous-ensembles, comme indiqué précédemment. La preuve serait l'induction sur le nombre de jeux. Le cas de base est déjà prouvé et pour l'étape d'induction, vous devez appliquer une chaîne d'égalité similaire à cette dernière.k


Je ne vois pas comment la question est claire. Les deux ensembles de données sont-ils supposés provenir de la même distribution? Le PO dispose-t-il des observations réelles ou uniquement des estimations de l'écart moyen et de l'écart type?
Michael R. Chernick

Oui, ils sont supposés provenir de la même distribution. Les observations ne sont pas disponibles, mais seulement la moyenne et l'écart type des sous-ensembles.
iipr

Alors pourquoi utiliser une formule qui implique les observations individuelles?
Michael R. Chernick

Peut-être que ma réponse n'est pas claire. Je poste simplement une preuve mathématique de la formule ci-dessus qui permet de calculer à spartir des écarts-types, des moyennes et des tailles de deux sous-ensembles. Dans la formule, il n'y a aucune référence aux observations individuelles. Dans la preuve il y a, mais c'est juste une preuve, et de mon point de vue, correct.
iipr
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.