J'essaie de comprendre la logique de séparation d dans les réseaux bayésiens causaux. Je sais comment fonctionne l'algorithme, mais je ne comprends pas exactement pourquoi le "flux d'informations" fonctionne comme indiqué dans l'algorithme.
Par exemple dans le graphique ci-dessus, supposons que l'on ne nous donne que X et qu'aucune autre variable n'a été observée. Ensuite selon les règles de la d-séparation, le flux d'information de X à D:
X influence A, qui est . C'est OK, puisque A cause X et si nous connaissons l'effet X, cela affecte notre croyance sur la cause A. Flux d'informations.
X influence B, qui est . C'est OK, puisque A a été modifié par nos connaissances sur X, le changement en A peut également influencer nos croyances sur sa cause, B.
X influence C, qui est . C'est correct parce que nous savons que B est biaisé par notre connaissance de son effet indirect, X, et puisque B est biaisé par X, cela influencera tous les effets directs et indirects de B. C est un effet direct de B et il est influencé par nos connaissances sur X.
Eh bien, jusqu'à présent, tout est OK pour moi car le flux d'informations se produit selon des relations de cause à effet intuitives. Mais je n'obtiens pas le comportement spécial des soi-disant "structures en V" ou "collisionneurs" dans ce schéma. Selon la théorie de la séparation d, B et D sont les causes courantes de C dans le graphique ci-dessus et il dit que si nous n'avons pas observé C ou l'un de ses descendants, les informations de flux de X sont bloquées en C. Eh bien, OK , mais ma question est pourquoi?
À partir des trois étapes ci-dessus, à partir de X, nous avons vu que C est influencé par nos connaissances sur X et le flux d'informations s'est produit en fonction de la relation de cause à effet. La théorie de la d-séparation dit que nous ne pouvons pas passer de C à D car C n'est pas observé. Mais je pense que puisque nous savons que C est biaisé et que D est une cause de C, D devrait également être affecté alors que la théorie dit le contraire. Il me manque clairement quelque chose dans ma façon de penser, mais je ne vois pas ce que c'est.
J'ai donc besoin d'une explication de la raison pour laquelle le flux d'informations bloqué en C, si C n'est pas observé.