Une raison très probable de la corrélation de 2 variables est que leurs changements sont liés à une troisième variable. D'autres raisons probables sont le hasard (si vous testez suffisamment de variables non corrélées pour la corrélation, certaines montreront une corrélation) ou des mécanismes très complexes qui impliquent plusieurs étapes.
Voir http://tylervigen.com/ pour des exemples comme celui-ci:
Pour énoncer en toute confiance la causalité de A -> B, vous avez besoin d'une expérience où vous pouvez contrôler la variable A et ne pas influencer les autres variables. Ensuite, vous mesurez si la corrélation de A et B existe toujours si vous modifiez votre variable.
Pour presque toutes les applications pratiques, il n'est presque pas possible de ne pas influencer également d'autres variables (souvent inconnues), donc le mieux que nous puissions faire est de prouver l'absence de causalité.
Pour pouvoir énoncer une relation causale, vous commencez avec l'hypothèse que 2 variables ont une relation causale, utilisez une expérience pour réfuter l'hypothèse et si vous échouez, vous pouvez affirmer avec un degré de certitude que l'hypothèse est vraie. La hauteur de votre degré de certitude dépend de votre domaine de recherche.
Dans de nombreux domaines, il est courant ou nécessaire d'exécuter 2 parties de votre expérience en parallèle, une où la variable A est modifiée et un groupe de contrôle où la variable A n'est pas modifiée, mais l'expérience est par ailleurs exactement la même - par exemple en cas de médicament, vous continuez de coller des sujets avec une aiguille ou de leur faire avaler des comprimés. Si l'expérience montre une corrélation entre A et B, mais pas entre A et B '(B du groupe témoin), vous pouvez supposer un lien de causalité.
Il existe également d'autres moyens de conclure à la causalité, si une expérience n'est pas possible ou déconseillée pour diverses raisons (morale, éthique, RP, coût, temps). Une façon courante consiste à utiliser la déduction. Prenons un exemple d'un commentaire: pour prouver que le tabagisme provoque le cancer chez l'homme, nous pouvons utiliser une expérience pour prouver que le tabagisme provoque le cancer chez la souris, puis prouver qu'il existe une corrélation entre le tabagisme et le cancer chez l'homme, et en déduire que c'est donc extrêmement probable que le tabagisme provoque le cancer chez l'homme - cette preuve peut être renforcée si nous réfutons également que le cancer provoque le tabagisme. Une autre façon de conclure à la causalité est l'exclusion d'autres causes de la corrélation, laissant la causalité comme la meilleure explication restante de la corrélation - cette méthode n'est pas toujours applicable, car il est parfois impossible d'éliminer toutes les causes possibles de la corrélation (appelées "chemins de porte dérobée" dans une autre réponse). Dans l'exemple tabagisme / cancer, nous pourrions probablement utiliser cette approche pour prouver que le tabagisme est responsable du goudron dans les poumons, car il n'y a pas beaucoup de sources possibles pour cela.
Ces autres façons de «prouver» la causalité ne sont pas toujours idéales d'un point de vue scientifique, car elles ne sont pas aussi concluantes qu'une expérience plus simple. Le débat sur le réchauffement climatique est un excellent exemple pour montrer comment il est beaucoup plus facile de rejeter le lien de causalité qui n'a pas encore été prouvé de manière concluante avec une expérience reproductible.
Pour le soulagement comique, voici un exemple d'expérience qui est techniquement plausible, mais déconseillée pour des raisons non scientifiques (morale, éthique, relations publiques, coût):