L'action correspond à une intervention sur la variable qui la met àX xdo(x)Xx . Lorsque nous intervenons sur , cela signifie que les parents de n'affectent plus sa valeur, ce qui correspond à la suppression des flèches pointant vers Représentons donc cette intervention sur un nouveau DAG.X XXXX
Appelons la distribution d'observation originale et la distribution post-intervention . Notre objectif est d'exprimer en termes de . Notez que dans nous avons que . De plus, les probabilités pré-interventionnelles et post-interventionnelles partagent ces deux invariances: et puisque nous n'avons pas touché toute flèche entrant dans ces variables dans notre intervention. Donc:P ∗ P ∗ P P ∗ U ⊥ X P ∗ ( U ) = P ( U ) P ∗ ( Y | X , U ) = P ( Y | X , U )PP∗P∗PP∗U⊥XP∗(U)=P(U)P∗(Y|X,U)=P(Y|X,U)
P(Y|do(X)):=P∗(Y|X)=∑UP∗(Y|X,U)P∗(U|X)=∑UP∗(Y|X,U)P∗(U)=∑UP(Y|X,U)P(U)
La dérivation de la porte d'entrée est un peu plus élaborée. Remarquez d'abord qu'il n'y a pas de confusion entre et , donc,ZXZ
P(Z|do(X))=P(Z|X)
De plus, en utilisant la même logique pour dériver nous voyons que le contrôle de est suffisant pour dériver l'effet de sur , c'est-à-direX Z YP(Y|do(X))XZY
P(Y|do(Z))=∑X′P(Y|X′,Z)P(X′)
Où j'utilise le premier pour la commodité de la notation pour l'expression suivante. Donc, ces deux expressions sont déjà en termes de distribution pré-intervention, et nous avons simplement utilisé la logique de porte dérobée précédente pour les dériver.
La dernière pièce nous avons besoin est de déduire l'effet de sur combinant l'effet de sur et sur . Pour ce faire, notez dans notre graphique , puisque l'effet de sur est complètement médiée par et le trajet de porte dérobée de à est bloqué lors d'une intervention sur . Par conséquent:XYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX
P(Y|do(X))=∑ZP(Y|Z,do(X))P(Z|do(X))=∑ZP(Y|do(Z))P(Z|do(X))=∑Z∑X′P(Y|X′,Z)P(X′)P(Z|X)=∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)
Où peut être compris de la manière suivante: lorsque j'interviens sur , alors la distribution de change en ; mais j'interviens en fait sur donc je veux savoir à quelle fréquence prendrait une valeur spécifique quand je change , qui est .∑ZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))
Par conséquent, les deux ajustements vous donnent la même distribution post-interventionnelle sur ce graphique, comme nous l'avons montré.
En relisant votre question, il m'est venu à l'esprit que vous pourriez être intéressé à montrer directement que le côté droit des deux équations est égal dans la distribution pré-interventionnelle (ce qu'elles doivent être, étant donné notre dérivation précédente). Ce n'est pas difficile de montrer directement aussi. Il suffit de montrer que dans votre DAG:
∑X′P(Y|Z,X′)P(X′)=∑UP(Y|Z,U)P(U)
Notez que le DAG implique et alors:Y⊥X|U,ZU⊥Z|X
∑X′P(Y|Z,X′)P(X′)=∑X′(∑UP(Y|Z,X′,U)P(U|Z,X′))P(X′)=∑X′(∑UP(Y|Z,U)P(U|X′))P(X′)=∑UP(Y|Z,U)∑X′P(U|X′)P(X′)=∑UP(Y|Z,U)P(U)
Par conséquent:
∑ZP(Z|X)∑X′P(Y|X′,Z)P(X′)=∑ZP(Z|X)∑UP(Y|Z,U)P(U)=∑UP(U)∑ZP(Y|Z,U)P(Z|X)=∑UP(U)∑ZP(Y|Z,X,U)P(Z|X,U)=∑UP(Y|X,U)P(U)