Utilisez les définitions de moyenne
μ1:n=1n∑i=1nxi
et variance d'échantillon
σ21:n=1n∑i=1n(xi−μ1:n)2=n−1n(1n−1∑i=1n(xi−μ1:n)2)
(le dernier terme entre parenthèses est l’ estimateur de variance non biaisé souvent calculé par défaut dans un logiciel statistique) pour trouver la somme des carrés de toutes les données . Ordonnons les indices i pour que i = 1 , … , n désigne les éléments du premier groupe et i = n + 1 , … , n + m désigne les éléments du deuxième groupe. Casser cette somme de carrés par groupe et reformuler les deux éléments en termes de variance et de moyenne des sous-ensembles de données:xiii=1,…,ni=n+1,…,n+m
(m+n)(σ21:m+n+μ21:m+n)=∑i=11:n+mx2i=∑i=1nx2i+∑i=n+1n+mx2i=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n).
Résoudre algébriquement ceci pour en fonction des autres quantités (connues)σ2m+n
σ21:m+n=n(σ21:n+μ21:n)+m(σ21+n:m+n+μ21+n:m+n)m+n−μ21:m+n.
Bien sûr, en utilisant la même approche, peut également être exprimé en termes de moyenne de groupe.μ1:m+n=(nμ1:n+mμ1+n:m+n)/(m+n)
An anonymous contributor points out that when the sample means are equal (so that μ1:n=μ1+n:m+n=μ1:m+n), the solution for σ2m+n is a weighted mean of the group sample variances.