Je sais que la corrélation n'implique pas de causalité mais une absence de corrélation implique une absence de causalité?
Je sais que la corrélation n'implique pas de causalité mais une absence de corrélation implique une absence de causalité?
Réponses:
une absence de corrélation implique-t-elle une absence de causalité?
Non, tout système contrôlé est un contre-exemple.
Sans relation de cause à effet, le contrôle est clairement impossible, mais un contrôle réussi signifie, en gros, qu'une quantité est maintenue constante, ce qui implique qu'elle ne sera pas corrélée à rien, y compris à tout ce qui la cause.
Donc, dans cette situation, ne conclure aucune relation de cause à effet par un manque de corrélation serait une erreur.
Voici un exemple un peu d'actualité .
Non, principalement parce que par corrélation, vous avez probablement une corrélation linéaire moyenne . Deux variables peuvent être corrélées de manière non linéaire et peuvent ne montrer aucune corrélation linéaire . Il est facile de construire un exemple comme celui-là, mais je vais vous donner un exemple plus proche de votre question (plus étroite).
Regardons la variable aléatoire et la fonction non aléatoire , avec laquelle nous créons une variable aléatoire . La dernière est clairement causée par la première variable, pas seulement corrélée. Tirons un nuage de points:
Belle image de corrélation non linéaire claire , mais dans ce cas, c'est aussi une causalité directe. Cependant, le coefficient de corrélation linéaire est non significatif, c'est-à-dire qu'il n'y a pas de corrélation linéaire malgré une corrélation non linéaire évidente, et même de causalité:
>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)
rho =
0.0140
pval =
0.8904
MISE À JOUR: @Kodiologist est juste dans le commentaire. On peut montrer mathématiquement que le coefficient de corrélation linéaire pour ces deux variables est bien nul. Dans mon exemple, est la variable normale standard. Nous avons donc les éléments suivants: Par conséquent, la covariance (et par conséquent la corrélation) est égale à zéro:
Nous obtiendrions le même résultat pour toute distribution symétrique, telle que l'uniforme .
Non . En particulier, les variables aléatoires peuvent être dépendantes mais non corrélées.
Voici un exemple. Supposons que j'ai une machine qui prend une seule entrée et produit un nombre aléatoire , qui est égal à ou avec une probabilité égale. Il est clair provoque . Soit maintenant une variable aléatoire uniformément répartie sur et sélectionnez avec , induisant une distribution jointe sur . et sont dépendants, puisque
Cependant, la corrélation de et est 0, carY
La meilleure réponse à la question est que la corrélation est une relation statistique, mathématique et / ou physique alors que la causalité est une relation métaphysique. Vous ne pouvez pas LOGICIELLEMENT passer de corrélation (ou non corrélation) à causalité, sans un (grand) ensemble d’hypothèses liant la métaphysique à la physique. (Un exemple est que ce que deux personnes pourraient accepter d'être "un observateur rationnel" est dans une large mesure arbitraire et probablement ambigu). Si A paie B pour faire C qui donne D, quelle est la cause de D? Il n'y a tout simplement aucune raison rationnelle de choisir C ou B ou A (ou l'un des événements précurseurs de A). La théorie du contrôle traite des systèmes dans des domaines où ils sont sous contrôle. Une façon de maîtriser une variable dépendante consiste à réduire la réponse de cette variable à la plage possible de variation (contrôlée) de la variable indépendante par rapport au bruit statistique. Par exemple, nous savons que la pression atmosphérique est corrélée à la santé (essayez juste de respirer le vide), mais si nous contrôlons la pression atmosphérique à 1 +/- 0,001 atm, quelle est la probabilité que TOUTE variation de la pression atmosphérique affecte la santé?
Oui , contrairement aux réponses précédentes. Je vais prendre la question comme non technique, en particulier la définition de "corrélation". Peut-être que je l'utilise trop largement, mais voyez ma deuxième puce. J'espère qu'il sera jugé approprié de discuter d'autres réponses ici, car elles éclairent différentes parties de la question. Je m'inspire de l'approche de Pearl en matière de causalité, et en particulier de celle que je traduis dans quelques articles avec Kevin Korb. Woodward a probablement le compte non technique le plus clair.
@conjugateprior dit "tout système contrôlé est un contre-exemple". Oui, à l'affirmation plus forte que la non-corrélation observée dans votre expérience n'implique aucune cause. Je vais supposer que la question est plus générale. Il est certain qu'une expérience aurait peut-être échoué à contrôler les causes de masquage ou à contrôler de manière inappropriée les effets courants et à masquer la corrélation. Mais si cause , il y aura une expérience contrôlée où cette relation est révélée. Presque toutes les définitions ou comptes de causalité la traitent comme une différence qui fait la différence. Donc pas de causalité sans (quelque sorte de) corrélation. S'il existe un lien direct dans un réseau causal bayésien, cela ne signifie pas quey x → y x y y x y fait toujours la différence pour , seulement il y a une expérience qui corrige toutes les autres causes de où remuer remue .
@aksakal a un bon exemple de la raison pour laquelle la causalité linéaire est insuffisante. D'accord, mais je veux être large et non technique. Si , il est incomplet de dire à un client que n'est pas corrélé avec . J'utiliserai donc très largement la corrélation pour désigner une différence de associée de manière fiable à une différence de . Il peut être non linéaire ou non paramétrique à votre guise. Les effets de seuil sont acceptables ( fait la différence avec , mais uniquement sur une plage finie, ou uniquement en étant supérieur ou inférieur à une valeur particulière, comme la tension dans les circuits numériques). y x x y x y
@Kodiologist crée un exemple où , doncmais pas de corrélation linéaire. Mais il existe clairement une relation à découvrir, donc corrélée au sens large.| y | = | x |
@Szabolcs utilise des générateurs de nombres aléatoires pour montrer un flux de sortie conçu pour apparaître non corrélé. Comme les chiffres de , le flux semble aléatoire mais est déterministe. Je conviens qu'il est peu probable que l'on trouve la relation si on ne donne que les données, mais c'est là.
@Li Zhi note que vous ne pouvez pas logiquement passer d'une corrélation à une causalité. Oui, pas de cause, pas de cause. Mais la question commence par la causalité: cela implique-t-il une corrélation? Dans l'exemple de la pression atmosphérique, nous avons un effet de seuil. Il existe une plage où la pression atmosphérique n'est pas corrélée avec la santé. En effet plausiblement où il n’a aucun effet causal sur la santé. Mais il y a une gamme où il fait. C'est suffisant. Mais probablement mieux de noter les plages où il y a et n’est pas un effet. Si , il existe une corrélation tout au long de la chaîne, car il y a un lien de causalité. Une observation répétée (ou une expérience) peut montrer que ne cause pas directementA D mais la corrélation est là parce qu'il y a une histoire causale.
Je ne sais pas ce que @ user2088176 avait en tête, mais je pense que si nous prenons la question très généralement, alors la réponse est oui. Au moins, je pense que c'est la réponse requise de la littérature sur la découverte causale et du récit interventionniste de la causalité. Les causes sont des différences qui font la différence. Et cette différence sera révélée, dans certaines expériences, comme une association persistante.