La corrélation est-elle équivalente à l'association?


27

Mon professeur de statistique prétend que le mot "corrélation" s'applique strictement aux relations linéaires entre les variables, tandis que le mot "association" s'applique largement à tout type de relation. En d'autres termes, il prétend que le terme "corrélation non linéaire" est un oxymore.

D'après ce que je peux faire de cette section dans l'article de Wikipedia sur " Corrélation et dépendance ", le coefficient de corrélation de Pearson décrit le degré de "linéarité" dans la relation entre deux variables. Cela suggère que le terme "corrélation" s'applique en fait exclusivement aux relations linéaires.

D'un autre côté, une recherche rapide sur Google de la " corrélation non linéaire " révèle un certain nombre d'articles publiés qui utilisent le terme.

Mon professeur a-t-il raison, ou "corrélation" est-elle simplement synonyme d '"association"?


1
À l'inverse, il existe également une «association linéaire».
Bogdanovist

Réponses:


37

Non; la corrélation n'est pas équivalente à l'association. Cependant, la signification de la corrélation dépend du contexte.

La définition classique de la statistique est, pour citer l'Encyclopédie des Sciences Statistiques de Kotz et Johnson "une mesure de la force de la relation linéaire entre deux variables aléatoires". En statistique mathématique, la "corrélation" semble généralement avoir cette interprétation.

Dans les domaines appliqués où les données sont généralement ordinales plutôt que numériques (par exemple, la psychométrie et les études de marché), cette définition n'est pas aussi utile que le concept de linéarité suppose des données qui ont des propriétés d'échelle d'intervalle. Par conséquent, dans ces domaines, la corrélation est plutôt interprétée comme indiquant un modèle bivarié croissant ou décroissant monotone ou, une corrélation des rangs. Un certain nombre de statistiques de corrélation non paramétriques ont été développées spécifiquement pour cela (par exemple, la corrélation de Spearman et le tau-b de Kendall). Celles-ci sont parfois appelées "corrélations non linéaires" car ce sont des statistiques de corrélation qui ne supposent pas de linéarité.

Parmi les non-statisticiens, la corrélation signifie souvent une association (parfois avec et parfois sans connotation causale). Indépendamment de l'étymologie de la corrélation, la réalité est que parmi les non-statisticiens, elle a ce sens plus large et aucune quantité de les réprimander pour une utilisation inappropriée est susceptible de changer cela. J'ai fait un "google" et il semble que certaines utilisations de la corrélation non linéaire semblent être de ce type (en particulier, il semble que certaines personnes utilisent le terme pour désigner une relation non linéaire fluide entre les variables numériques) .

La nature dépendante du contexte du terme "corrélation non linéaire" signifie peut-être qu'il est ambigu et ne devrait pas être utilisé. En ce qui concerne la "corrélation", vous devez déterminer le contexte de la personne qui utilise le terme afin de savoir ce que cela signifie.


6
+1 Une réponse réfléchie et compétente. Veuillez envisager de qualifier le «non» initial, car il faut un peu de lecture et de réflexion pour comprendre s'il signifie «non, le professeur n'est pas correct» ou «non, la« corrélation »n'est pas synonyme de« causalité »,» ou la conjonction des deux.
whuber

Merci pour le commentaire; J'ai modifié ma réponse en conséquence.
Tim

1
Il s'agit d'une excellente réponse (et d'une question) qui soulève des problèmes plus vastes concernant la terminologie, le langage et la communication en général, dont nous devons tous nous préoccuper.
Peter Ellis

3
Alors qu'est-ce que l'association, alors?
Sheep

5

Je ne vois pas grand intérêt à essayer de démêler les termes «corrélation» et «association». Après tout, Pearson lui-même (et d'autres) a développé une mesure de relation non linéaire qu'ils ont appelé le « rapport de corrélation ».


1
Oui, il semble à ce stade qu'ils sont assez difficiles à démêler, surtout compte tenu de l'histoire (par exemple, comme vous le mentionnez) et de la perception sociale.
Behacad

2

Il semble y avoir un malentendu d'association. Les mesures d'association (ampleur de l'effet) sont inhérentes à l'analyse quantitative et non qualitative.


1
Vous devriez peut-être penser à transformer cela en commentaire. Les réponses sont généralement un peu plus étendues
PhDing

@Alessandro Yup, plus nécessaire pour une réponse, mais l'OP n'a pas assez de réputation (> +50) pour commenter tout à fait encore. Peut-être que le modérateur pourra le convertir en commentaire pour lui.
Carl

0

Je dirais que la corrélation s'applique aux données quantitatives et l'association aux données qualitatives et les deux n'ont pas de relation causale obligatoire.


Qu'entendez-vous par «association à des données qualitatives»?
Randel

0

L'idée que le poids (d'un homme) n'est pas corrélé à la taille (car la fonction correspondante est du 3ème degré, non linéaire) me semble très étrange. La corrélation linéaire doit être traitée comme un cas particulier d'association.


1
Mais contre quelle (ou contre) idée vous opposez-vous? La corrélation peut être calculée ici comme (b) corrélation entre les valeurs observées et prédites à partir de n'importe quelle combinaison de termes ainsi que (vraisemblablement) (a) corrélation non nulle entre le poids et la taille.
Nick Cox

-1

La corrélation et l'association sont différentes. La corrélation décrit les trois types de relations positives, négatives et non corrélées. Il décrit également l'ampleur de la corrélation de 0 à 1, de -1 à 0. L'association ne révèle pas quels types d'association et combien d'association.


Quelle est la question ici?
Christoph Hanck

Comme vous ne définissez pas l'association ou n'expliquez pas en quoi elle diffère, il est difficile de voir pourquoi vous pensez avoir répondu à la question. Cela n'ajoute rien aux réponses précédentes.
Nick Cox

-2

En ce qui concerne la linéarité, la réponse de Tim et Nick Cox l'a complètement couverte. Là où je pensais pouvoir contribuer, c'est une façon claire de penser à la différence entre association et corrélation.

Association --- mesure la relation étroite entre deux variables (c.-à-d. Si elles sont dépendantes ou indépendantes).

Corrélation --- mesure de quelle manière deux variables sont liées (c.-à-d. Positives ou négatives).


En fin de compte, je dirais que vous ne pouvez jamais vous tromper en les traitant distinctement, cela aidera à l'interprétation et aux analyses à long terme. J'espère que cela t'aides.


2
Je n'ai pas downvote cela, et merci pour le commentaire positif (je viens d'appliquer une modification). Malheureusement, cela brouille la discussion. Les mesures d'association n'ont souvent rien à voir avec la variable dépendante, le cas échéant. La corrélation mesure aussi «à quel point»: chaque définition de la corrélation est basée sur une définition spécifique de la façon dont les variables sont (idéalement) liées (linéairement, monotones, etc.) Les exemples familiaux n'aident vraiment pas, même en tant qu'analogies: egmère, père, oncle ne sont pas des variables quantitatives dans l'exemple. Donc, désolé, mais la distinction que vous faites n'est pas nette du tout.
Nick Cox

De plus, le «sang partagé» et l '«éloignement» sont très différents!
Nick Cox
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.