Quelles sont les techniques empiriques pour montrer la causalité?

12

Une régression linéaire simple ne montre que la corrélation entre deux variables. Pour établir la causalité, deux méthodes couramment enseignées sont la régression IV et les expériences naturelles. Quelles sont les autres méthodes utilisées par les gens pour établir le lien de causalité?

econometrics identification

— Bravo
source

2

Il est contesté si la régression IV en dit long sur la causalité

— EnergyNumbers

15

Les expériences naturelles sont généralement un cadre pour l'inférence causale plutôt qu'un outil d'inférence causale en soi. Vous devez souvent utiliser quelque chose comme des différences de différence ou des variables instrumentales de toute façon même lorsque vous avez une expérience naturelle.

Voici une liste d'approches d'inférence causale statistique (Approche: Description profane)

Variables instrumentales : la variable assignée au hasard X influence Z uniquement par Y
Différence dans les différences : si deux groupes ont une tendance commune et qu'un seul groupe est traité, alors le changement dans la différence entre les groupes est l'effet du traitement
Régression Discontinuité : Si un traitement déterminé par un seuil difficile, regardez la différence tout autour de ce seuil
Appariement du score de propension : créez un groupe témoin en faisant correspondre les observations non traitées qui étaient susceptibles d'être traitées (mais pas en fait traitées) avec des observations traitées avec une probabilité de traitement similaire.
Appariement de distance de Manhalobis : créez un groupe témoin en faisant correspondre les observations non traitées qui ressemblent à celles traitées. Une autre mesure de distance notable est l' appariement exact grossier .
Contrôle synthétique : lorsque vous n'avez qu'une seule observation traitée, créez un composite d'observations non traitées qui sont individuellement des contrôles imparfaits mais agissent collectivement comme un bon contrôle.
Cohortes synthétiques - Traitez les observations répétées de groupes comme un panel d'individus et utilisez des techniques de panel.
Modélisation du biais de sélection comme la correction Heckman : Supposons une forme paramétrique pour le biais de sélection et supprimez-la, afin que les résultats de régression corrigés puissent être interprétés de manière causale.
Pondération plus large de l'échantillon - correction du biais résultant de la participation endogène et de l'hétérogénéité non modélisée en pondérant les unités d'échantillonnage pour qu'elles ressemblent davantage à la véritable population d'intérêt.

— BKay
source

Pour une liste de méthodes, vous pouvez jeter un œil à notre ReplicationWiki. Les études qui les utilisent sont répertoriées, et vous pouvez rechercher lesquelles d'entre elles disposent de données et de code, comme ici pour les différences de différences .

— Jan Höffler

1

La différence de différence est probablement la méthode préférée en économétrie (bien qu'elle nécessite un bootstraping, c'est-à-dire une correction des données par auto-corrélation). Il compare fondamentalement l'évolution de deux groupes, d'un point auquel aucun n'est soumis au facteur donné à un point auquel l'un d'eux est soumis au facteur. Un exemple célèbre est l'utilisation par Card et Krueger de la méthode pour étudier l'impact d'un salaire minimum.

— VicAche
source

Si quelqu'un sait comment je peux réduire cette image, n'hésitez pas à la modifier;)

— VicAche

Utilisez simplement le code d'image HTML standard: (par exemple, <img src = "URL" width = "100" height = "100">)

— BKay

1

La différence de différence n'établit pas le lien de causalité. Il établit la taille possible d'un effet; mais pas la causalité.

— EnergyNumbers

Quantifier les effets, c'est estimer la causalité, du moins telle que OP la comprend.

— VicAche

1

La conception de discontinuité de régression tout comme la différence dans les différences est une méthode d'exploitation des expériences naturelles. Il s'appuie sur des règles arbitraires qui donnent différents "traitements" à des unités par ailleurs similaires.

Un exemple de Wikipedia:

Si tous les élèves au-dessus d'une note donnée - par exemple 80% - reçoivent la bourse, il est possible d'obtenir l'effet du traitement local en comparant les étudiants autour du seuil de 80%: l'intuition ici est qu'un étudiant obtenant 79% est probable être très semblable à un étudiant obtenant 81% — étant donné le seuil prédéfini de 80%, cependant, un étudiant recevra la bourse tandis que l'autre ne le recevra pas. La comparaison du résultat du boursier (groupe de traitement) avec le résultat contrefactuel du non-bénéficiaire (groupe témoin) produira donc l'effet du traitement local.

— snoram
source

1

Pour donner suite au commentaire de @EnergyNumbers, la causalité découle de votre théorie .

Une distinction clé est la suivante: les mathématiques de l'une des méthodes de la réponse de @ BKay sont conçues pour cracher des nombres à la fin de la procédure. Par exemple, considérez un diff-in-diff où votre traitement est quelque chose de stupide comme être léché au visage par un chien. Vous pouvez toujours mettre en place un diff-in-diff pour voir si le fait d'être léché au visage par des chiens fait que les gens deviennent des astronautes.

Mis à part la bêtise, penser à la causalité à partir de zéro peut être très utile - pour inclure votre choix de procédure. Les séminaires d'économie tournent souvent autour de la viabilité de la théorie et de la validité des hypothèses.

— Pat W.
source