La réponse de JohnRos est très bonne. En clair, endogénéité signifie que vous avez mal interprété le lien de causalité. Le modèle que vous avez écrit et estimé ne rend pas correctement compte de la manière dont la causalité fonctionne dans le monde réel. Quand tu écris:
Yje= β0+ β1Xje+ ϵje
vous pouvez penser à cette équation de plusieurs façons. Vous pourriez penser à cela comme un moyen pratique de prédire fonction des valeurs deVous pourriez penser à cela comme un moyen pratique de modéliser . Dans l'un ou l'autre de ces cas, l'endogénéité n'existe pas et vous n'avez pas à vous en préoccuper.X E { Y | X }YXE{ Y|X}
Cependant, vous pouvez également considérer l'équation comme une incarnation de la causalité. Vous pouvez penser à comme la réponse à la question: "Qu'arriverait-il à si dans ce système et si de façon expérimentale ?" Si vous voulez y penser de cette façon, utiliser OLS pour estimer cela revient à supposer que: Y Xβ1YX
- YX causeY
- Yε causeY
- Xε ne cause pasX
- XY ne cause pasX
- Rien qui provoque provoque aussiXεX
En cas d'échec de l'un des 3 à 3, vous obtiendrez généralement ou, pas tout à fait de manière équivalente, . Les variables instrumentales sont un moyen de corriger le fait que la causalité est erronée (en faisant une autre hypothèse causale différente). Un essai contrôlé randomisé parfaitement conduit est un moyen de forcer la vérité entre 3 et 5. Si vous choisissez au hasard, cela n’est certainement pas causé par , ou autre chose. Les méthodes dites "d'expérimentation naturelle" sont des tentatives de trouver des circonstances spéciales dans le monde où 3 à 5 sont vraies, même si nous ne pensons pas que 3 à 5 sont généralement vraies.C o v ( X , ε ) ≠ 0 X Y εE{ E |X} ≠ 0C o v ( X, ϵ ) ≠ 0XYε
Dans l'exemple de JohnRos, pour calculer la valeur salariale de l'éducation, vous avez besoin d'une interprétation causale de , mais il y a de bonnes raisons de croire que 3 ou 5 est faux.β1
Votre confusion est compréhensible, cependant. Il est très typique dans les cours sur le modèle linéaire que l’instructeur utilise l’interprétation causale de j’ai donnée ci-dessus en prétendant ne pas introduire la causalité, en prétendant que "ce n’est que des statistiques". C'est un mensonge lâche, mais c'est aussi très courant. β1
En fait, cela fait partie d'un phénomène plus vaste en biomédecine et en sciences sociales. Nous essayons presque toujours de déterminer l’effet causal de sur - c’est le but de la science après tout. D’autre part, il est également presque toujours possible de raconter une histoire qui mène à la conclusion que l’une des 3 à 3 est fausse. Il existe donc une sorte de malhonnêteté fluide, équivoque et pratiquée dans laquelle nous dissipons les objections en disant que nous ne faisons que du travail associatif, puis que l’interprétation causale est réintroduite ailleurs (normalement dans les sections d’introduction et de conclusion du document).YXY
Si vous êtes vraiment intéressé, le type à lire est Judea Perl. James Heckman est également bon.
R
.