La variance d'une somme est-elle égale à la somme des variances?

62

Est-il vrai (toujours) que

V a r (\sum_{i = 1}^{m} X_{i}) = \sum_{i = 1}^{m} V a r (X_{i}) ?

$\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)} \>?$

variance

— Abe
source

3

Les réponses ci-dessous fournissent la preuve. L'intuition peut être vue dans le cas simple var (x + y): si x et y sont corrélés positivement, les deux auront tendance à être grands / petits ensemble, augmentant ainsi la variation totale. S'ils sont corrélés négativement, ils auront tendance à s'annuler, ce qui réduira la variation totale.

— Assad Ebrahim

92

La réponse à votre question est "Parfois, mais pas en général".

Pour voir ceci, prenons des variables aléatoires (avec variances finies). Ensuite, $X_1, ..., X_n$

v a r (\sum_{i = 1}^{n} X_{i}) = E ({[\sum_{i = 1}^{n} X_{i}]}^{2}) - {[E (\sum_{i = 1}^{n} X_{i})]}^{2}

${\rm var} \left( \sum_{i=1}^{n} X_i \right) = E \left( \left[ \sum_{i=1}^{n} X_i \right]^2 \right) - \left[ E\left( \sum_{i=1}^{n} X_i \right) \right]^2$

Notez maintenant que , ce qui est clair si vous Pensez à ce que vous faites lorsque vous calculez à la main. Donc, $(\sum_{i=1}^{n} a_i)^2 = \sum_{i=1}^{n} \sum_{j=1}^{n} a_i a_j$ $(a_1+...+a_n) \cdot (a_1+...+a_n)$

E ({[\sum_{i = 1}^{n} X_{i}]}^{2}) = E (\sum_{i = 1}^{n} \sum_{j = 1}^{n} X_{i} X_{j}) = \sum_{i = 1}^{n} \sum_{j = 1}^{n} E (X_{i} X_{j})

$E \left( \left[ \sum_{i=1}^{n} X_i \right]^2 \right) = E \left( \sum_{i=1}^{n} \sum_{j=1}^{n} X_i X_j \right) = \sum_{i=1}^{n} \sum_{j=1}^{n} E(X_i X_j)$

De même,

{[E (\sum_{i = 1}^{n} X_{i})]}^{2} = {[\sum_{i = 1}^{n} E (X_{i})]}^{2} = \sum_{i = 1}^{n} \sum_{j = 1}^{n} E (X_{i}) E (X_{j})

$\left[ E\left( \sum_{i=1}^{n} X_i \right) \right]^2 = \left[ \sum_{i=1}^{n} E(X_i) \right]^2 = \sum_{i=1}^{n} \sum_{j=1}^{n} E(X_i) E(X_j)$

alors

v a r (\sum_{i = 1}^{n} X_{i}) = \sum_{i = 1}^{n} \sum_{j = 1}^{n} (E (X_{i} X_{j}) - E (X_{i}) E (X_{j})) = \sum_{i = 1}^{n} \sum_{j = 1}^{n} c o v (X_{i}, X_{j})

${\rm var} \left( \sum_{i=1}^{n} X_i \right) = \sum_{i=1}^{n} \sum_{j=1}^{n} \big( E(X_i X_j)-E(X_i) E(X_j) \big) = \sum_{i=1}^{n} \sum_{j=1}^{n} {\rm cov}(X_i, X_j)$

par la définition de covariance.

Maintenant en ce qui concerne la variance d'une somme égale à la somme des variances? :

Si les variables ne sont pas corrélées, oui : c’est-à-dire pour , puis ${\rm cov}(X_i,X_j)=0$ $i\neq j$
$v a r (\sum_{i = 1}^{n} X_{i}) = \sum_{i = 1}^{n} \sum_{j = 1}^{n} c o v (X_{i}, X_{j}) = \sum_{i = 1}^{n} c o v (X_{i}, X_{i}) = \sum_{i = 1}^{n} v a r (X_{i})$ ${\rm var} \left( \sum_{i=1}^{n} X_i \right) = \sum_{i=1}^{n} \sum_{j=1}^{n} {\rm cov}(X_i, X_j) = \sum_{i=1}^{n} {\rm cov}(X_i, X_i) = \sum_{i=1}^{n} {\rm var}(X_i)$
Si les variables sont corrélées, non, pas de manière générale : supposons par exemple sont deux variables aléatoires, chacune avec la variance et où . Alors , l'identité échoue donc. $X_1, X_2$ $\sigma^2$ ${\rm cov}(X_1,X_2)=\rho$ $0 < \rho <\sigma^2$ ${\rm var}(X_1 + X_2) = 2(\sigma^2 + \rho) \neq 2\sigma^2$
mais il est possible pour certains exemples : Supposons que aient une matrice de covariance puis $X_1, X_2, X_3$
$(\begin{array}{ccc} 1 & 0.4 & - 0.6 \\ 0.4 & 1 & 0.2 \\ - 0.6 & 0.2 & 1 \end{array})$ $\left( \begin{array}{ccc} 1 & 0.4 &-0.6 \\ 0.4 & 1 & 0.2 \\ -0.6 & 0.2 & 1 \\ \end{array} \right)$ ${\rm var}(X_1+X_2+X_3) = 3 = {\rm var}(X_1) + {\rm var}(X_2) + {\rm var}(X_3)$

Par conséquent, si les variables ne sont pas corrélées, la variance de la somme est la somme des variances, mais l'inverse n'est pas vrai en général.

— Macro
source

En ce qui concerne la matrice de covariance est-elle correcte? La symétrie entre les triangles supérieur droit et inférieur gauche reflète le fait que , mais la symétrie entre le coin supérieur gauche et le coin inférieur droit (dans ce cas, fait simplement partie de l'exemple, mais peut être remplacé par deux les nombres qui totalisent par exemple, et ? Merci encore

cov (X_{i}, X_{j}) = cov (X_{j}, X_{i})

$\text{cov}(X_i,X_j)=\text{cov}(X_j,X_i)$

cov (X_{1}, X_{2}) = cov (X_{2}, X_{3}) = 0.3

$\text{cov}(X_1, X_2) = \text{cov}(X_2,X_3) = 0.3$

0.6

$0.6$

cov (X_{1}, X_{2}) = a

$\text{cov}(X_1, X_2) = a$

cov (X_{2}, X, 3) = 0.6 - a

$\text{cov}(X_2,X,3) = 0.6 -a$

— Abe

42

Var (\sum_{i = 1}^{m} X_{i}) = \sum_{i = 1}^{m} Var (X_{i}) + 2 \sum_{i < j} Cov (X_{i}, X_{j}) .

$\text{Var}\bigg(\sum_{i=1}^m X_i\bigg) = \sum_{i=1}^m \text{Var}(X_i) + 2\sum_{i\lt j} \text{Cov}(X_i,X_j).$

Donc, si les covariances sont moyennes à , ce qui serait une conséquence si les variables ne sont pas corrélées par paires ou si elles sont indépendantes, la variance de la somme est la somme des variances. $0$

Un exemple où ce n'est pas vrai: Soit . Soit . Ensuite, . $\text{Var}(X_1)=1$ $X_2 = X_1$ $\text{Var}(X_1 + X_2) = \text{Var}(2X_1)=4$

— Douglas Zare
source

Ce sera rarement le cas pour les variances de l'échantillon.

— Din

1

@DWin, "rare" est un euphémisme - si les ont une distribution continue, la probabilité que la variance de la somme de l'échantillon soit égale à la somme des variances de l'échantillon dans exactement 0 :)

X

$X$

— Macro

15

Je voulais juste ajouter une version plus succincte de la preuve donnée par Macro, pour que ce soit plus facile de voir ce qui se passe. $\newcommand{\Cov}{\text{Cov}}\newcommand{\Var}{\text{Var}}$

Notez que depuis $\Var(X) = \Cov(X,X)$

Pour deux variables aléatoires on a: $X,Y$

\begin{aligned} Var (X + Y) & = Cov (X + Y, X + Y) \\ = E ((X + Y)^{2}) - E (X + Y) E (X + Y) \\ by expanding, \\ = E (X^{2}) - (E (X))^{2} + E (Y^{2}) - (E (Y))^{2} + 2 (E (X Y) - E (X) E (Y)) \\ = Var (X) + Var (Y) + 2 (E (X Y)) - E (X) E (Y)) \end{aligned}

$\begin{align} \Var(X+Y) &= \Cov(X+Y,X+Y) \\ &= E((X+Y)^2)-E(X+Y)E(X+Y) \\ &\text{by expanding,} \\ &= E(X^2) - (E(X))^2 + E(Y^2) - (E(Y))^2 + 2(E(XY) - E(X)E(Y)) \\ &= \Var(X) + \Var(Y) + 2(E(XY)) - E(X)E(Y)) \\ \end{align}$ Donc, en général, la variance de la somme de deux variables aléatoires n'est pas la somme des variances. Cependant, si sont indépendants, alors , et nous avons .

X, Y

$X,Y$

E (X Y) = E (X) E (Y)

$E(XY) = E(X)E(Y)$

Var (X + Y) = Var (X) + Var (Y)

$\Var(X+Y) = \Var(X) + \Var(Y)$

Notez que nous pouvons produire le résultat pour la somme de variables aléatoires par une simple induction. $n$

— Omar Haque
source

11

Oui, si chaque paire de n'est pas corrélée, c'est vrai. $X_i$

Voir l' explication sur Wikipedia

— Abe
source

Je suis d'accord. Vous trouverez également une simple explication sur Insight Things .

— Jan Rothkegel