Le problème avec votre raisonnement est
"Je pense que nous pouvons toujours supposer que est indépendant des autres "XXX
X X X XX n'est pas indépendant de . Le symbole est utilisé ici pour faire référence à la même variable aléatoire. Une fois que vous connaissez la valeur du premier à apparaître dans votre formule, cela corrige également la valeur du second à apparaître. Si vous voulez qu'ils se réfèrent à des variables aléatoires distinctes (et potentiellement indépendantes), vous devez les désigner avec des lettres différentes (par exemple et ) ou en utilisant des indices (par exemple et ); cette dernière est souvent (mais pas toujours) utilisée pour désigner des variables tirées de la même distribution.XXXXY X 1 XXYX1X2
Si deux variables et sont indépendantes alors est le même que : connaître la valeur de ne nous donne pas d'informations supplémentaires sur la valeur de . Mais est si et autrement: connaître la valeur de vous donne des informations sur la valeur de . [Vous pouvez remplacer les probabilités dans ce paragraphe par des fonctions de distribution cumulative, ou, le cas échéant, des fonctions de densité de probabilité, pour essentiellement le même effet.]Y Pr ( X = a | Y = b ) Pr ( X = a ) Y X Pr ( X = a | X = b ) 1 a = b 0 X XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0XX
Une autre façon de voir les choses est que si deux variables sont indépendantes alors elles ont une corrélation nulle (bien que la corrélation nulle n'implique pas l'indépendance !) Mais est parfaitement corrélé avec lui-même, donc ne peut pas être indépendant de lui-même. Notez que puisque la covariance est donnée par , alorsCorr ( X , X ) = 1 X Cov ( X , Y ) = Corr (XCorr(X,X)=1X Cov(X,XCov(X,Y)=Corr(X,Y)Var(X)Var(Y)−−−−−−−−−−−−√
Cov(X,X)=1Var(X)2−−−−−−−√=Var(X)
La formule plus générale de la variance d'une somme de deux variables aléatoires est
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
En particulier, , doncCov(X,X)=Var(X)
Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)
qui est le même que vous auriez déduit de l'application de la règle
Var(aX)=a2Var(X)⟹Var(2X)=4Var(X)
Si vous êtes intéressé par la linéarité, alors vous pourriez être intéressé par la bilinéarité de la covariance. Pour les variables aléatoires , , et (qu'elles soient dépendantes ou indépendantes) et les constantes , , et nous avonsX Y Z a b cWXYZabcd
Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)
Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)
et dans l'ensemble,
Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)
Vous pouvez ensuite l'utiliser pour prouver les résultats (non linéaires) de la variance que vous avez écrits dans votre message:
Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)
Var(aX+bY)Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)=a2Var(X)+b2Var(Y)+2abCov(X,Y)
Ce dernier donne, comme cas particulier lorsque ,a=b=1
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
Lorsque et sont pas corrélés (ce qui inclut le cas où ils sont indépendants), cela se réduit à . Donc, si vous voulez manipuler les variances de manière "linéaire" (ce qui est souvent une bonne façon de travailler algébriquement), utilisez plutôt les covariances et exploitez leur bilinéarité.XYVar(X+Y)=Var(X)+Var(Y)