"Conditionnement" est un mot de la théorie des probabilités: https://en.wikipedia.org/wiki/Conditional_probability
Le conditionnement sur C signifie que nous ne regardons que les cas où C est vrai. "Implicitement" signifie que nous ne pouvons pas rendre cette restriction explicite, parfois même pas au courant de le faire.
Le point signifie que, lorsque A et B provoquent tous deux C, l'observation d'une corrélation entre A et B dans les cas où C est vrai, ne signifie pas qu'il existe une véritable relation entre A et B.Ce conditionne simplement C (peut-être involontairement) que crée une corrélation artificielle.
Prenons un exemple.
Dans un pays, il existe exactement deux sortes de maladies, parfaitement indépendantes. Appelez A: "la personne a la première maladie", B: "la personne a la deuxième maladie". Supposons que , P ( B ) = 0,1 .P(A)=0.1P(B)=0.1
Maintenant, toute personne qui a une de ces maladies va voir le médecin et alors seulement. Appelez C: "la personne va voir le médecin". Nous avons .C=A or B
Calculons maintenant quelques probabilités:
- P(C)=0.19
- P(A|C)=P(B|C)=0.10.19≈0.53
- P(A and B|C)=0.010.19≈0.053
- P(A|C)P(B|C)≈0.28
Clairement, conditionnés sur C, et B sont très loin d'être indépendants. En fait, conditionnés en C, n o t A semble "cause" B .ABnotAB
Si vous utilisez la liste des personnes qui , où enregistrées par leur médecin (s) en tant que source de données pour une analyse, alors il semble y avoir une forte corrélation entre les maladies et B . Vous ne savez peut-être pas que votre source de données est en fait un conditionnement. Ceci est également appelé "biais de sélection".AB