Intuition derrière la formule de la variance d'une somme de deux variables


10

Je sais par des études antérieures que

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

Cependant, je ne comprends pas pourquoi. Je peux voir que l'effet sera de «faire monter» la variance lorsque A et B covarient fortement. Il est logique que lorsque vous créez un composite à partir de deux variables hautement corrélées, vous aurez tendance à ajouter les observations élevées de A aux observations élevées de B, et les observations faibles de A aux observations faibles de B. Cela aura tendance à créer des valeurs extrêmement élevées et faibles dans la variable composite, augmentant la variance du composite.

Mais pourquoi fonctionne-t-il pour multiplier la covariance par exactement 2?


1
Si UNE et B sont parfaitement corrélés positivement, alors et s'ils sont parfaitement corrélés négativement alorsVar(A+B)=Var(A)+Var(B)-2Vuner(UNE+B)=Vuner(UNE)+Vuner(B)+2Vuner(UNE)Vuner(B) . La covariance mesure l'étendue de cette relation dans cette plageVuner(UNE+B)=Vuner(UNE)+Vuner(B)-2Vuner(UNE)Vuner(B)
Henry

Réponses:


21

Réponse simple:

La variance implique un carré:

Vuner(X)=E[(X-E[X])2]

Donc, votre question se résume au facteur 2 de l'identité du carré:

(une+b)2=une2+b2+2uneb

Ce qui peut être compris visuellement comme une décomposition de l'aire d'un carré de côté en aire des petits carrés des côtés a et b , en plus de deux rectangles des côtés a et b :(une+b)unebuneb

entrez la description de l'image ici

Réponse plus impliquée:

Si vous voulez une réponse mathématiquement plus impliquée, la covariance est une forme bilinéaire, ce qui signifie qu'elle est linéaire dans ses premier et deuxième arguments, cela conduit à:

Vuner(UNE+B)=Cov(UNE+B,UNE+B)=Cov(UNE,UNE+B)+Cov(B,UNE+B)=Cov(UNE,UNE)+Cov(UNE,B)+Cov(B,UNE)+Cov(B,B)=Vuner(UNE)+2Cov(UNE,B)+Vuner(B)

Dans la dernière ligne, j'ai utilisé le fait que la covariance est symétrique:

Cov(UNE,B)=Cov(B,UNE)

Pour résumer:

Il s'agit de deux parce que vous devez prendre en compte à la fois et c o v ( B , A ) .cov(UNE,B)cov(B,UNE)


5

L'ensemble des variables aléatoires est un espace vectoriel, et de nombreuses propriétés de l'espace euclidien peuvent y être analogues. L'écart type agit un peu comme une longueur et la variance comme une longueur au carré. L'indépendance correspond à une orthogonalité, tandis qu'une parfaite corrélation correspond à une multiplication scalaire. Ainsi, la variance des variables indépendantes suit le théorème de Pythagore:
.vuner(UNE+B)=vuner(UNE)+vuner(B)

S'ils sont parfaitement corrélés, alors
st(UNE+B)=st(UNE)+st(B)

Notez que cela équivaut à
vuner(UNE+B)=vuner(UNE)+vuner(B)+2vuner(UNE)vuner(B)

S'ils ne sont pas indépendants, ils suivent alors une loi analogue à la loi des cosinus:
vuner(UNE+B)=vuner(UNE)+vuner(B)+2cov(UNE,B)

Notez que le cas général se situe entre l'indépendance complète et la corrélation parfaite. Si et B sont indépendants, alors c o v ( A , B ) est nul. Donc, le cas général est que v a r ( A , B ) a toujours un terme v a r ( A ) et un terme v a r ( B ) , puis il a une certaine variation sur le 2 UNEBcov(UNE,B)vuner(UNE,B)vuner(UNE)vuner(B) ; plus les variables sont corrélées, plus ce troisième terme sera grand. Et c'est précisément ce que2cov(A,B)est: c'est22vuner(UNE)vuner(B)2cov(UNE,B) fois ler2deAetB.2vuner(UNE)vuner(B)r2UNEB

vuner(UNE+B)=vuner(UNE)+vuner(B)+MeunesureOFCorrelunetjeonPerFectCorrelunetjeonTerm

MeunesureOFCorrelunetjeon=r2PerFectCorrelunetjeonTerm=2vuner(UNE)vuner(B)

r=correl(UNE,B)

σUNE+B=σUNE2+σB2+2(rσUNE)(rσB)

r2cos


2

Vuner(UNE+B)VunerCov

UNE+B

  1. UNE
  2. B
  3. UNEB
  4. BUNE

Vuner(UNE+B)=Vuner(UNE)+Vuner(B)+Cov(UNE,B)+Cov(B,UNE)
=Vuner(UNE)+Vuner(B)+2Cov(UNE,B)
Cov
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.