Je crois que la réponse rapide d'une phrase à votre question,
Quand est-il approprié de contrôler la variable Y et quand non?
est le "critère de la porte dérobée".
Le modèle de causalité structurelle de Judea Pearl peut vous dire définitivement quelles variables sont suffisantes (et quand cela est nécessaire) pour le conditionnement, afin d'inférer l'impact causal d'une variable sur une autre. À savoir, ceci est répondu en utilisant le critère de la porte dérobée, qui est décrit à la page 19 de ce document de synthèse par Pearl.
La principale mise en garde est qu'elle vous oblige à connaître la relation causale entre les variables (sous la forme de flèches directionnelles dans un graphique). Il n'y a aucun moyen de contourner cela. C'est là que la difficulté et l'éventuelle subjectivité peuvent entrer en jeu. Le modèle causal structurel de Pearl vous permet uniquement de savoir comment répondre aux bonnes questions en fonction d'un modèle causal (c'est-à-dire un graphique dirigé), quel ensemble de modèles causaux est possible compte tenu d'une distribution de données, ou comment rechercher la structure causale en effectuant la bonne expérience. Il ne vous dit pas comment trouver la bonne structure causale compte tenu uniquement de la distribution des données. En fait, il prétend que cela est impossible sans utiliser des connaissances / intuitions externes sur la signification des variables.
Les critères de porte dérobée peuvent être énoncés comme suit:
Pour trouver l'impact causal de sur Y , un ensemble de nœuds variables S suffit pour être conditionné tant qu'il satisfait aux deux critères suivants:XOui,S
1) Aucun élément de n'est un descendant de XSX
2) bloque tous les chemins "de porte dérobée" entre X et YSXOui
Ici, un chemin « porte arrière » est tout simplement un chemin de flèches qui commencent à et se terminent par une flèche pointant vers X . (La direction que pointent toutes les autres flèches n'est pas importante.) Et le "blocage" est, en soi, un critère qui a une signification spécifique, qui est donné à la page 11 du lien ci-dessus. Il s'agit du même critère que vous liriez lorsque vous vous renseigneriez sur la «séparation D». J'ai personnellement trouvé que le chapitre 8 de Bishop's Pattern Recognition and Machine Learning décrit le concept de blocage dans la séparation D bien mieux que la source Pearl que j'ai liée ci-dessus. Mais ça se passe comme ceci:OuiX.
Un ensemble de nœuds, bloque un chemin entre X et Y s'il satisfait au moins un des critères suivants:S,XOui
1) L'un des nœuds du chemin, qui est également en émet au moins une flèche sur le chemin (c'est-à-dire que la flèche pointe loin du nœud)S,
2) Un nœud qui n'est ni en ni un ancêtre d'un nœud en S a deux flèches dans le chemin "entrant en collision" vers lui (c'est-à-dire le rencontrant tête à tête)SS
Il s'agit d'un critère ou , contrairement au critère général de porte dérobée qui est un critère et .
Pour être clair sur le critère de la porte dérobée, ce qu'il vous dit, c'est que, pour un modèle causal donné, en conditionnant sur une variable suffisante, vous pouvez apprendre l'impact causal de la distribution de probabilité des données. (Comme nous le savons, la distribution conjointe à elle seule n'est pas suffisante pour trouver un comportement causal car plusieurs structures causales peuvent être responsables de la même distribution. C'est pourquoi le modèle causal est également requis.) La distribution peut être estimée à l'aide de statistiques / méthodes d'apprentissage automatique sur les données d'observation. Aussi longtemps que vous le savez que la structure causale permet de conditionner une variable (ou un ensemble de variables), votre estimation de l'impact causal d'une variable sur une autre est aussi bonne que votre estimation de la distribution des données, que vous obtenez par des méthodes statistiques.
Voici ce que nous constatons lorsque nous appliquons le critère de porte dérobée à vos deux diagrammes:
Dans aucun cas ne il existe un chemin porte arrière de à X . Il est donc vrai que Y bloque "tous" les chemins de porte dérobée, car il n'y en a pas. Cependant, dans le diagramme de gauche, Y est un descendant direct de X , alors que dans le diagramme de droite, il ne l'est pas. Par conséquent, Y suit le critère de la porte dérobée dans le diagramme de droite, mais pas celui de gauche. Ce sont des résultats sans surprise.ZX.OuiOuiX,Oui
OuiXZXOuiOuiOuiZ.OuiOui.X.OuiYYXY
YYXZ.
YX.ZX.
Z←Y→XZ←W→B←A→X. YY B,B,YZ←Y→X
Z←W→B→Y→X. Y Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAWBAWXZ
Comme je l'ai mentionné précédemment, l'utilisation du critère de porte dérobée nécessite que vous connaissiez le modèle causal (c'est-à-dire le diagramme "correct" des flèches entre les variables). Mais le modèle causal structurel, à mon avis, donne également le moyen le meilleur et le plus formel de rechercher un tel modèle, ou de savoir quand la recherche est vaine. Il a également le merveilleux effet secondaire de rendre obsolètes des termes comme «confondant», «médiation» et «faux» (qui me confondent tous). Montrez-moi simplement l'image et je vous dirai quels cercles doivent être contrôlés.