Dans les commentaires, 15 façons de comprendre le coefficient de corrélation ont été suggérées:
Les 13 voies discutées dans l'article de Rodgers et Nicewander (The American Statistician, février 1988) sont
Une fonction des scores et des moyens bruts,
r = ∑ ( Xje- X¯) ( Yje- Oui¯)∑ ( Xje- X¯)2( Yje- Oui¯)2------------------√.
Covariance standardisée,
r = sXOui/ ( sXsOui)
où est la covariance de l'échantillon et et sont les écarts-types de l'échantillon. s X s YsXOuisXsOui
Pente normalisée de la ligne de régression,
r = bOui⋅ XsXsOui= bX⋅ YsOuisX,
où et sont les pentes des droites de régression. b X ⋅ YbOui⋅ XbX⋅ Y
La moyenne géométrique des deux pentes de régression,
r = ± bOui⋅ XbX⋅ Y-------√.
La racine carrée du rapport de deux variances (proportion de la variabilité prise en compte),
r = ∑ ( Yje- Ouije^)2∑ ( Yje- Oui¯)2------------⎷= SSR EgSSTO T------√= sOui^sOui.
Le produit croisé moyen des variables standardisées,
r = ∑ zXzOui/ N.
Une fonction de l'angle entre les deux lignes de régression normalisées. Les deux droites de régression ( vs et vs ) sont symétriques par rapport à la diagonale. Soit l'angle entre les deux lignes soit . alorsX X Y βOuiXXOuiβ
r=sec(β)±tan(β).
Une fonction de l'angle entre les deux vecteurs variables,
r=cos(α).
Une variance redimensionnée de la différence entre les scores normalisés. Laisser être la différence entre normalisés et des variables pour chaque observation, X YzY−zXXY
r=1−s2(zY−zX)/2=s2(zY+zX)/2−1.
Estimé à partir de la règle du "ballon",
r≈1−(h/H)2−−−−−−−−−√
où est la plage verticale de l'ensemble du diagramme de dispersion et est la plage passant par le "centre de la distribution sur l' axe " (c'est-à-dire par le point de moyenne).X - Y h XHX−YhX
En relation avec les ellipses bivariées de l'isoconcentration,
r=D2−d2D2+d2
où et sont respectivement les longueurs des axes majeur et mineur. également égal à la pente de la ligne tangente d'un isocontour (en coordonnées normalisées) au point où le contour traverse l'axe vertical.d rDdr
Une fonction des statistiques de test des expériences conçues,
r=tt2+n−2−−−−−−−−√
où est la statistique du test dans un échantillon deux échantillons indépendants pour une expérience conçue avec deux conditions de traitement (codé ) et est le nombre total combiné d'observations dans les deux groupes de traitement.ttX=0,1n
Le rapport de deux moyens. Supposons une normalité bivariée et normalisons les variables. Sélectionnez une valeur arbitrairement grande de . alorsXcX
r=E(Y|X>Xc)E(X|X>Xc).