J'admets que je suis relativement nouveau dans les scores de propension et l'analyse causale.
Une chose qui ne me semble pas évident en tant que nouveau venu est de savoir en quoi l’équilibrage à l’aide des scores de propension est mathématiquement différent de ce qui se produit lorsque nous ajoutons des covariables dans une régression. En quoi l'opération est-elle différente et pourquoi est-elle (ou est-elle) meilleure que l'ajout de covariables de sous-population dans une régression?
Certaines études comparent empiriquement les méthodes, mais je n'ai pas vu de bonne discussion relier les propriétés mathématiques des deux méthodes et expliquer pourquoi PSM se prête à des interprétations causales alors que l'inclusion de covariables de régression ne le fait pas. Il semble également y avoir beaucoup de confusion et de controverse dans ce domaine, ce qui rend les choses encore plus difficiles à comprendre.
Avez-vous des idées à ce sujet ou des indicateurs de bonnes ressources / documents pour mieux comprendre la distinction? (Je fais lentement mon chemin à travers le livre de causalité de Judea Pearl, donc pas besoin de m'indiquer ça)