Les variables aléatoires sont-elles corrélées si et seulement si leurs rangs sont corrélés?

Supposons que sont des variables aléatoires continues avec des seconds moments finis. La version démographique du coefficient de corrélation de rang de Spearman peut être définie comme le coefficient produit-moment de Pearson ρ des intégrales de probabilité transforme et , où sont les cdf de et , c'est-à-dire, $X,Y$ $ρ_s$ $F_X(X)$ $F_Y(Y)$ $F_X,F_Y$ $X$ $Y$

$ρ_s(X,Y)=ρ(F(X),F(Y))$ .

Je me demande si l'on peut généralement conclure que

$ρ(X,Y)≠0↔ρ(F(X),F(Y))≠0$ ?

Autrement dit, avons-nous une corrélation linéaire si et seulement si nous avons une corrélation linéaire entre les rangs?

Mise à jour: Dans les commentaires, deux exemples sont donnés pourquoi

$\rho(F_X(X),F_Y(Y))=0\rightarrow \rho(X,Y) = 0$

n'est pas vrai en général, même si $X$ et $Y$ ont la même distribution. La question devrait donc être reformulée

$\rho(X,Y) = 0 \rightarrow \rho(F_X(X),F_Y(Y))$ ?

Il est également très intéressant pour moi de savoir si cela est vrai / faux si $X$ et $Y$ ont la même distribution.

(Remarque: si $X$ et $Y$ dépendent positivement du quadrant, c'est-à-dire, $δ(x,y)=F_{X,Y}(x,y)−F_X(x)F_Y(y)>0$ alors la formule de covariance de Hoeffding $Cov(X,Y)=∫∫δ(x,y)dxdy$ donne que $ρ(X,Y)>0$ et $ρ(F(X),F(Y))>0$ )

correlation pearson-r spearman-rho

— FSpanhel
source

Astuce: Pour obtenir une réponse, pensez à ce qui arrive à chaque mesure de corrélation sous une transformation arbitraire strictement monotone.

— Cardinal

@cardinal: eh bien, le rho de Spearman est invariant sous des transformations strictement monotones, le coefficient de corrélation linéaire classique va changer, mais il est difficile de savoir comment (?) ... en particulier, je ne sais pas si la valeur de corrélation linéaire peut changer sa valeur de zéro à non nul sous des transformations strictement monotones ... mais peut-être que j'ai raté votre point?

— FSpanhel

Tu es sur la bonne piste! Soit et . Maintenant, regardez les transformations strictement monotones de ces deux. Je n'ai pas explicitement vérifié, mais est susceptible de fonctionner.

X \sim N (0, 1)

$X \sim \mathcal{N}(0,1)$

Y = X^{2}

$Y = X^2$

g (z) = \exp (- z / 2)

$g(z) = \exp(-z/2)$

— cardinal

Vous avez raison. Le deuxième exemple ne fonctionne pas comme je le pensais / le soupçonnais. Cependant, le principe général sur la façon de construire un tel contre-exemple est toujours valable. Et, oui, cette question peut être étroitement liée aux copules. :-)

— Cardinal

Une fois que vous avez confirmé vos contre-exemples, veuillez envisager de les écrire dans une réponse à ce message. Je serai heureux de le voter. À votre santé.

— cardinal

Aucune des deux corrélations étant zéro vous en dit nécessairement beaucoup sur l'autre, car ils «pondèrent» les données - en particulier les données extrêmes - de manière très différente. Je vais juste jouer avec des échantillons, mais des exemples similaires pourraient être construits avec des distributions / copules bivariées.

1. La corrélation de Spearman 0 n'implique pas la corrélation de Pearson 0 :

Comme mentionné dans la question, il y a des exemples dans les commentaires, mais la structure de base est "construire un cas où la corrélation de Spearman est 0, puis prendre un point extrême et le rendre plus extrême sans changer la corrélation de Spearman"

Les exemples dans les commentaires couvrent très bien cela, mais je vais juste jouer avec un exemple plus «aléatoire» ici. Considérez donc ces données (en R), qui par construction ont à la fois une corrélation de Spearman et Pearson 0:

x=c(0.660527211673069, 0.853446087136149, -0.00673848667511427, 
-0.730570343152498, 0.0519171047989013, 0.00190761493801791, 
-0.72628058443299, 2.4453231076856, -0.918072410495674, -0.364060229489348, 
-0.520696233492491, 0.659907250608776)
y=c(-0.0214697990371976, 0.255615059485107, 1.10561181413232, 0.572216886959267, 
-0.929089680725018, 0.530329993414123, -0.219422799586819, -0.425186120279194, 
-0.848952532832652, 0.859700836483046, -0.00836246690850083, 
1.43806947831794)

cor(x,y);cor(x,y,method="sp")
[1] 1.523681e-18
[1] 0

Maintenant, ajoutez 1000 à y [12] et soustrayez 0,6 de x [9]; la corrélation de Spearman est inchangée mais la corrélation de Pearson est maintenant de 0,1841:

  ya=y
  ya[12]=ya[12]+1000
  xa=x
  xa[9]=xa[9]-.6
  cor(xa,ya);cor(xa,ya,method="sp")
[1] 0.1841168
[1] 0

(Si vous voulez une forte signification sur cette corrélation de Pearson, répliquez simplement l'échantillon entier plusieurs fois.)

2. La corrélation de Pearson 0 n'implique pas la corrélation de Spearman 0 :

Voici deux exemples avec une corrélation Pearson nulle mais une corrélation Spearman non nulle (et encore une fois, si vous voulez une forte signification sur ces corrélations Spearman, il suffit de répliquer plusieurs fois l'intégralité de l'échantillon).

Exemple 1:

 x1=c(rep(-3.4566679074320789866,20),-2:5)
 y1=x1*x1
 cor(x1,y1);cor(x1,y1,method="spe")
[1] -8.007297e-17 
[1] -0.3512699

points sur une parabole arrangée pour donner 0 corrélation de Pearson, mais non nulle de Spearman

Exemple 2:

 k=16.881943016134132 
 x2=c(-9:9,-k,k)
 y2=c(-9:9,k,-k)
 cor(x2,y2);cor(x2,y2,method="spe")
[1] -9.154471e-17
[1] 0.4805195

points sur la ligne ay = x, sauf les plus petits et les plus grands qui se trouvent sur y = -x

Dans ce dernier exemple, la corrélation de Spearman peut être renforcée en ajoutant plus de points sur y = x tout en rendant les deux points en haut à gauche et en bas à droite plus extrêmes pour maintenir la corrélation de Pearson à 0.

— Glen_b -Reinstate Monica
source