Pourquoi


8

Tout d’abord, j’apprécie que les discussions sur r2 provoquent généralement des explications sur R2(c.-à-d. le coefficient de détermination en régression). Le problème auquel je cherche à répondre est de généraliser cela à toutes les instances de corrélation entre deux variables.

Donc, je suis perplexe sur la variance partagée depuis un bon moment. J'ai eu quelques explications, mais elles semblent toutes problématiques:

  1. C'est juste un autre terme pour covariance. Cela ne peut pas être le cas, car la littérature sur l'analyse factorielle fait la différence entre l'ACP et l'EPT en déclarant que ce dernier explique la variance partagée et le premier ne le fait pas (l'APC tient évidemment compte de la covariance en ce qu'elle opère sur une matrice de covariance, donc partagée la variance doit être un concept distinct).

  2. Il s'agit du coefficient de corrélation au carré (r2). Voir:

Cela a un peu plus de sens. Le problème ici est d'interpréter comment cela implique qu'il s'agit d'une variance partagée. Par exemple, une interprétation de la «variance de partage» estcov(A,B)/[var(A)+var(B)]. r2 ne se réduit pas à cela, ni même à un concept facilement intuitif [cov(A,B)2/(var(A)×var(B)); qui est un objet à 4 dimensions].

Les liens ci-dessus tentent tous deux de l'expliquer via un diagramme Ballentine. Ils n'aident pas. Premièrement, les cercles sont de taille égale (ce qui semble être important pour l'illustration pour une raison quelconque), ce qui ne tient pas compte des écarts inégaux. On pourrait supposer que ce sont les diagrammes de Ballentine pour les variables standardisées, donc la variance égale, auquel cas le segment qui se chevauchent expliquerait la covariance entre deux variables standardisées (la corrélation). Doncr, ne pas r2.

TL; DR: Les explications de la variance partagée disent ceci:

En quadrillant le coefficient, vous savez combien de variance, en pourcentage, les deux variables partagent.

Pourquoi en serait-il ainsi?


1
Les deux points ("covariance" et "r-carré") sont des interprétations correctes. Je vous recommande cette ma réponse:r2est le produit de deux grandeurs relatives de la covariance et est une probabilité quasi conjointe.
ttnphns

1
Au sein de l'EPT, ils disent généralement «variance commune», et non «variance partagée». La variance commune est le domaine de la colinéarité totale. En revanche, le terme "variance partagée" n'est pas tout à fait défini (votre question est de savoir comment le définir).
ttnphns

1
Les diagrammes de Venn (Ballentine) ne relient pas correctement le concept de r2parce que la magnitude de la covariance n'est pas la zone d'intersection des deux cercles (variances). La covariance dépend des deux variances. La taille de la covariance peut être plus grande que la taille de la plus petite variance (ce qui est certainement impossible à montrer sur Venn par intersection).
ttnphns

1
Cela nous ramène à la définition régressionnelle de r2 comme 1SSresid/SStot. Donc, si la situation est homoscédastique, vous pouvez vous voir facilement ...
ttnphns

1
La covariance est la "variance partagée", l'amplitude brute de if. Normalisé à une magnitude relative, il peut être de deux versions, r et r-sq. r-sq peut être interprété comme% de la variance partagée de la variance combinée.
ttnphns

Réponses:


3

On ne peut que deviner ce que pourrait signifier un auteur en particulier par «variance partagée». Nous pourrions espérer circonscrire les possibilités en considérant quelles propriétés ce concept devrait (intuitivement) avoir. On sait que "les variances s'ajoutent": la variance d'une sommeX+ε est la somme des variances de X et ε quand X et εont une covariance nulle. Il est naturel de définir la "variance partagée" desX la somme étant la fraction de la variance de la somme représentée par la variance de X. Cela suffit pour impliquer les écarts de partage des deux variables aléatoiresX et Y doit être le carré de leur coefficient de corrélation.

Ce résultat donne un sens à l'interprétation d'un coefficient de corrélation au carré comme une "variance partagée": dans un sens approprié, c'est vraiment une fraction d'une variance totale qui peut être affectée à une variable de la somme.

Les détails suivent.

Principes et leurs implications

Bien sûr si Y=X, leur "variance partagée" (appelons-la désormais "SV") devrait être de 100%. Mais siY et Xsont juste des versions échelonnées ou décalées les unes des autres? Par exemple, siY représente la température d'une ville en degrés F et Xreprésente la température en degrés C? Je voudrais suggérer que dans de tels casX et Y devrait toujours avoir 100% SV, de sorte que ce concept restera significatif quelle que soit la façon dont X et Y pourrait être mesurée:

(1)SV(α+βX,γ+δY)=SV(X,Y)

pour tous les nombres α,γ et des nombres non nuls β,δ.

Un autre principe pourrait être que lorsque ε est une variable aléatoire indépendante de X, alors la variance de X+ε peut être décomposé de façon unique en deux parties non négatives,

Var(X+ε)=Var(X)+Var(ε),

suggérant que nous essayons de définir SV dans ce cas spécial comme

(2)SV(X,X+ε)=Var(X)Var(X)+Var(ϵ).

Étant donné que tous ces critères ne sont que du second ordre - ils ne concernent que les premier et deuxième moments des variables sous la forme d'attentes et de variances - assouplissons l'exigence selon laquelle X et εêtre indépendant et exiger seulement qu'ils ne soient pas corrélés . Cela rendra l'analyse beaucoup plus générale qu'elle ne le serait autrement.

Les resultats

Ces principes - si vous les acceptez - conduisent à un concept unique, familier et interprétable. L'astuce sera de réduire le cas général au cas particulier d'une somme, où l'on pourra appliquer la définition(2).

Donné (X,Y), nous essayons simplement de décomposer Y dans une version évoluée et décalée de X plus une variable qui n'est pas corrélée avec X: c'est-à-dire, trouvons (si c'est possible) des constantes α et β et une variable aléatoire ϵ Pour qui

(3)Y=α+βX+ε

avec Cov(X,ε)=0. Pour que la décomposition ait une chance d'être unique, nous devons exiger

E[ε]=0

pour qu'une fois β est trouvé, α est déterminé par

α=E[Y]βE[X].

Cela ressemble énormément à une régression linéaire et c'est effectivement le cas. Le premier principe dit que nous pouvons redimensionnerX et Y avoir une variance unitaire (en supposant qu'ils ont chacun une variance non nulle) et que lorsque cela est fait, les résultats de régression standard affirment la valeur de β dans (3) est la corrélation de X et Y:

(4)β=ρ(X,Y).

De plus, en prenant les variances de (1) donne

1=Var(Y)=β2Var(X)+Var(ε)=β2+Var(ε),

impliquant

(5)Var(ε)=1β2=1ρ2.

par conséquent

SV(X,Y)=SV(X,α+βX+ε)(Model 3)=SV(βX,βX+ε)(Property 1)=Var(βX)Var(βX)+Var(ϵ)(Definition 2)=β2β2+(1β2)=β2(Result 5)=ρ2(Relation 4).

Notez que parce que le coefficient de régression sur Y (lorsqu'il est normalisé en fonction de la variance unitaire) est ρ(Y,X)=ρ(X,Y), la "variance partagée" elle-même est symétrique, justifiant une terminologie qui suggère l'ordre de X et Y n'a pas d'importance:

SV(X,Y)=ρ(X,Y)2=ρ(Y,X)2=SV(Y,X).
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.