Un modèle de causalité structurale probabiliste (en SCM) est défini comme un triplet où U est un ensemble de variables exogènes, V un ensemble de variables endogènes, F est un ensemble d'équations structurelles qui détermine les valeurs de chaque variable endogène et P ( U ) une distribution de probabilité sur le domaine de UM=⟨U,V,F,P(U)⟩UVFP(U)U .
Dans un SCM nous représentons l'effet d'une intervention sur une variable par un sous - modèle M x = ⟨ U , V , F x , P ( U ) ⟩ où F x indique que l'équation structurelle pour X est remplacée par la nouvelle équation interventionnelle . Par exemple, l'intervention atomique consistant à fixer la variable X à une valeur spécifique x --- généralement désignée par d o ( X = x ) --- consiste à remplacer l'équation pour XXMx=⟨U,V,Fx,P(U)⟩FxXXxdo(X=x)Xavec l'équation .X=x
Pour clarifier les idées, imaginez un modèle causal structurel non paramétrique défini par les équations structurelles suivantes:M
Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)
Où les perturbations ont une distribution de probabilité P ( U ) . Ceci induit une distribution de probabilité sur les variables endogènes P M ( Y , Z , X ) , et en particulier une distribution conditionnelle de Y étant donné X , P M ( Y | X ) .UP(U)PM(Y,Z,X)YXPM(Y|X)
Mais remarquez est la distribution « d' observation » de Y donné X dans le cadre du modèle M . Quel serait l'effet sur la distribution de Y si nous intervenions sur X en le fixant à x ? Ce n'est rien de plus que la distribution de probabilité de Y induite par le modèle modifié M x :PM(Y|X)YXMYXxYMx
Z=UzX=xY=g(X,Z,Uy)
Autrement dit, la probabilité interventionnelle de si nous fixons X = x est donnée par la probabilité induite dans le sous-modèle M x , c'est-à-dire P M x ( Y | X = x ) et elle est généralement désignée par P ( Y | d o ( X = x ) ) . L' opérateur d o ( X = x ) indique clairement que nous calculons la probabilité de YYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Ydans un sous-modèle où il y a un paramètre d'intervention égal à x , ce qui correspond à remplacer l'équation structurelle de X par l'équation X = x .XxXX=x
Le but de nombreuses analyses est de trouver comment exprimer la distribution interventionnelle en termes de probabilité conjointe de la distribution observationnelle (pré-intervention).P(Y|do(X))
faire du calcul
Le do-calcul n'est pas la même chose que l' opérateur . Le do-calcul consiste en trois règles d'inférence pour aider à "masser" la distribution de probabilité post-intervention et obtenir P ( Y | d o ( X ) ) en termes de distribution observationnelle (pré-intervention). Par conséquent, au lieu de faire des dérivations à la main, comme dans cette question, vous pouvez laisser un algorithme effectuer les dérivations et vous donner automatiquement une expression non paramétrique pour identifier votre requête causale d'intérêt (do(⋅)P(Y|do(X)) et le do-calcul est complet pour les modèles causaux structurels non paramétriques récursifs ).