L'expression «corrélation n'implique pas de causalité» est surestimée. (Comme l'écrivit Cohen, «c'est un très gros indice».) Nous avons frappé cette phrase chez les élèves en raison d'un biais intrinsèque à l'esprit humain. Lorsque vous entendez «le taux de criminalité est corrélé au taux de pauvreté», ou quelque chose comme ça, vous ne pouvez pas vous empêcher de penser que cela signifie que la pauvreté est à l'origine du crime. Il est naturel que les gens assument cela, car c'est ainsi que fonctionne l'esprit. Nous utilisons cette expression encore et encore dans l'espoir de contrer cela. Cependant, une fois que vous avez absorbé l'idée, la phrase perd la plus grande partie de sa valeur et il est temps de passer à une compréhension plus sophistiquée.
Lorsqu'il y a une corrélation entre deux variables, il y a deux possibilités: tout est une coïncidence, ou il y a un schéma causal à l'œuvre. Appeler un motif dans le monde une coïncidence est un terrible cadre explicatif et devrait probablement être votre dernier recours. Cela laisse la causalité. Le problème est que nous ne connaissons pas la nature de ce modèle causal. Il se pourrait bien que la pauvreté cause le crime, mais il se pourrait aussi que le crime cause la pauvreté (par exemple, les gens ne veulent pas vivre dans une zone à forte criminalité, alors ils déménagent et la valeur des propriétés chute, etc.). Il se pourrait aussi qu'il ya une troisième variable ou groupe de variables qui causent la criminalité et la pauvreté, mais qu'il ya, en fait, pas directelien de causalité entre la criminalité et la pauvreté (connu sous le nom de modèle de «cause commune»). Cela est particulièrement pernicieux, car, dans un modèle statistique, toutes les autres sources de variation sont regroupées dans le terme d'erreur de la variable dépendante. Par conséquent, la variable indépendante est corrélée avec (causée par) le terme d'erreur, ce qui entraîne un problème d' endogénéité . Ces problèmes sont très difficiles et ne doivent pas être pris à la légère. Néanmoins, même dans ce scénario, il est important de reconnaître qu'il existe une véritable causalité au travail.
En bref, quand vous voyez une corrélation, vous devriez penser qu'il y a probablement une sorte de causalité en jeu quelque part , mais que vous ne connaissez pas la nature de ce modèle causal.