Variance du produit des variables dépendantes


32

Quelle est la formule de variance du produit des variables dépendantes?

Dans le cas de variables indépendantes, la formule est simple:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Mais quelle est la formule des variables corrélées?

Au fait, comment puis-je trouver la corrélation basée sur les données statistiques?

Réponses:


32

Eh bien, en utilisant l'identité familière que vous avez indiquée,

var(XY)=E(X2Y2)E(XY)2

En utilisant la formule analogue pour la covariance,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

et

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

ce qui implique que, en général, peut s'écrirevar(XY)

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Notez que dans le cas de l'indépendance, et cela se réduit àcov(X2,Y2)=cov(X,Y)=0

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

et les deux termes s'annulent et vous obtenez[E(X)E(Y)]2

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

comme vous l'avez souligné ci-dessus.

Edit: Si tout ce que vous observez est et non X et Y séparément, alors je ne pense pas qu'il y ait un moyen d'estimer c o v ( X , Y ) ou c o v ( X 2 , Y 2 ) sauf dans des cas particuliers (par exemple, si X , Y ont des moyennes connues a priori )XYXYcov(X,Y)cov(X2,Y2)X,Y


2
pourquoi mettez-vous [var (X) + E (X) 2] ⋅ [var (Y) + E (Y) 2] au lieu de E (X2) E (Y2) ???

1
@ user35458, afin qu'il puisse se retrouver avec l'équation comme expression de var (X) et var (Y), donc comparable à la déclaration de OP. Notez que E (X ^ 2) = Var (X) + E (X) ^ 2.
Waldir Leoncio

2
Afin de répondre (hors ligne) à un défi désormais supprimé de la validité de cette réponse, j'ai comparé ses résultats au calcul direct de la variance du produit dans de nombreuses simulations. Ce n'est pas une formule pratique à utiliser si vous pouvez l'éviter, car elle peut perdre une précision substantielle par annulation en soustrayant un grand terme d'un autre - mais ce n'est pas le point. Un écueil à prendre en compte est que cette question concerne des variables aléatoires. Ses résultats s'appliquent aux données à condition que vous calculiez les variances et les covariances en utilisant les dénominateurs de n plutôt que n1 (comme cela est habituel pour les logiciels).
whuber

14

Il s'agit d'un addendum à la très belle réponse de @ Macro qui définit exactement ce qui doit être connu afin de déterminer la variance du produit de deux variables aléatoires corrélées. Depuis cov(X,Y),E[X],E[Y],E

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y] et E [ Y 2 ] X et Y sontindépendantesvariables aléatoires, puis cov ( X ,E[X2]E[Y2] peut être supposé être des quantités connues, nous devons être en mesure de déterminer la valeur de dans ( 2 ) ou cov ( X 2 , Y 2 ) dans ( 3 ) . Ce n'est pas facile à faire en général, mais, comme déjà souligné, si = cov ( X 2 , Y 2 ) = 0 . En fait, c'est la dépendance, et non la corrélation (ou son absence) qui est le problème clé. Que nous savons que cov (E[X2Y2](2)cov(X2,Y2)(3)XYmême s'il cov(X,Y)=cov(X2,Y2)=0 est égal à 0 au lieu de une valeur non nulle ne fonctionne pas,par luimême,aide le moins dans nos efforts sontdéterminer la valeur de E [ X 2 Y 2 ] ou cov ( X 2 , Y 2 ) nesimplifiera les côtés droitcov(X,Y)0E[X2Y2]cov(X2,Y2) et ( 3 ) un peu.(2)(3)

Lorsque et Y sont des variables aléatoires dépendantes , alors dans au moins un cas spécial (assez courant ou assez important), il est possible de trouver la valeur de E [ X 2 Y 2 ] relativement facilement.XYE[X2Y2]

Supposons que et Y sont des variables aléatoires conjointement normales avec un coefficient de corrélation ρ . Ensuite, conditionnée à X = x , la densité conditionnelle de Y est une densité normale avec la moyenne E [ Y ] + ρ XYρX=xYet variancevar(Y)(1-ρ2). Ainsi, E[X2Y2X]E[Y]+ρvar(Y)var(X)(xE[X])var(Y)(1ρ2) qui est unefonctionquartiquedeX, disonsg(X), et la loi de l'attente itérée nous dit que E[X2Y2]=E[E[X2Y2X]] où le côté droit de

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
Xg(X)
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
peut être calculé à partir de la connaissance des 3e et 4e moments de X - des résultats standard qui peuvent être trouvés dans de nombreux textes et ouvrages de référence (ce qui signifie que je suis trop paresseux pour les rechercher et les inclure dans cette réponse).(4)X

XY

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
Cov[x2,y2]E[(xE[x])2(yE[y])2]Cov[x2,y]Cov[x,y2]

E(X2Y2)
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.