Pour tout nombre y 1 , y 2 , … , y N avec moyenne
ˉ y = 1Ny1, y2, … , YN, la variance est donnée par
σ 2y¯= 1N∑i = 1Nyje
Application de(1)à l'ensemble donné dennombresx1,x2,…xn
que nous considérons par commodité dans l'exposition comme ayant une moyenneˉx=0, nous avons que
σ2=1
σ2σ2= 1N- 1∑i = 1N( yje- y¯)2= 1N- 1∑i = 1N( y2je- 2 yjey¯+ y¯2)= 1N- 1[ ( ∑i = 1Ny2je) -2N( y¯)2+ N( y¯)2]= 1N- 1∑i = 1N( y2je- ( y¯)2)(1)
( 1 )nX1, x2, … XnX¯= 0
Si nous ajoutons maintenant une nouvelle observation
xn+1à cet ensemble de données, alors la nouvelle moyenne de l'ensemble de données est
1σ2= 1n - 1∑i = 1n( x2je- ( x¯)2) = 1n - 1∑i = 1nX2je
Xn + 1
alors que la nouvelle variance est
σ 21n + 1∑i = 1n + 1Xje= n x¯+ xn + 1n + 1= xn + 1n + 1
Alors
| xn+1| doit être plus grand que
σ√σ^2= 1n∑i = 1n + 1( x2je- x2n + 1( n + 1 )2)= 1n[ ( ( n - 1 ) σ2+ x2n + 1) - x2n + 1n + 1]=1n[ (n-1) σ2+ nn + 1X2n + 1]> σ2 seulement si x 2n + 1> n + 1nσ2.
| Xn + 1|
ou, plus généralement,
xn+1doit différer deplus de
σ√de la moyenne
ˉxde l'ensemble de données d'origine
σ1 + 1n-----√Xn + 1X¯ , afin que l'ensemble de données augmenté présente une variance plus importante que l'ensemble de données d'origine. Voir aussi la réponse de Ray Koopman qui souligne que la nouvelle variance est supérieure, égale ou inférieure à la variance d'origine selon
xn+1
diffère de la moyenne de plus, exactement ou moins que
σ√σ1 + 1n-----√Xn + 1 .
σ1 + 1n-----√