Une explication géométrique-statistique.
Imaginez que vous fassiez un diagramme de dispersion "à l'envers" où les sujets sont les axes et les variables et les points . C'est ce qu'on appelle une parcelle d' espace sujet (par opposition à la parcelle d' espace variable habituelle ). Comme il n’ya que 2 points à tracer, toutes les dimensions d’un tel espace, à l’exception de deux dimensions quelconques pouvant supporter les 2 points plus l’origine, sont redondantes et peuvent être supprimées en toute sécurité. Et nous nous retrouvons avec un avion. Nous dessinons des flèches vectorielles de l'origine aux points: ce sont nos variables et tant que vecteurs dans l'espace sujet des données.2 X Y X Yn 2 XYXY
Or, si les variables étaient centrées dans un espace sujet, le cosinus de l'angle entre leurs vecteurs est leur coefficient de corrélation . Sur l'image ci-dessous , les vecteurs et sont orthogonaux: leur . L'absence de corrélation était un préalable requis par @Dilip dans sa réponse.Y r = 0XYr=0
Également pour les variables centrées, leurs longueurs vectorielles dans un sujet sont leurs écarts-types . Sur la photo, et sont de longueur égale, des variances égales étaient également une condition préalable créée par @Dilip.YXY
Pour dessiner la variable ou la variable nous utilisons simplement l’addition ou la soustraction vectorielle que nous avons oubliée depuis l’école (déplacez le vecteur Y jusqu’à la fin du vecteur X et inversez la direction en cas de soustraction, - ceci est indiqué par des flèches grises sur la photo, - tracez ensuite un vecteur à l'endroit indiqué par la flèche grise).X + YX−YX+Y
Il devient très clair que la longueur des vecteurs ou (l'écart type de ces variables) est, d'après le théorème de Pythagore, et que l'angle entre et ou est 45 degrés, qui cosinus - la corrélation - vautX + Y √X−YX+Y XX-YX+Y0,707 ...2σ2−−−√XX−YX+Y0.707...