Je me demande comment une variable instrumentale aborde le biais de sélection dans la régression.
Voici l'exemple que je mâche: dans la plupart des économétries inoffensives , les auteurs discutent d'une régression IV relative au service militaire et aux gains plus tard dans la vie. La question est: "Est-ce que le fait de servir dans l'armée augmente ou diminue les gains futurs?" Ils enquêtent sur cette question dans le contexte de la guerre du Vietnam. Je comprends que le service militaire ne peut pas être assigné au hasard et que c'est un problème d'inférence causale.
Pour résoudre ce problème, le chercheur utilise le projet d'admissibilité (comme dans «votre numéro de projet s'appelle») comme instrument pour le service militaire réel. Cela a du sens: le projet du Vietnam a affecté au hasard de jeunes hommes américains aux forces armées (en théorie - si les recrues ont effectivement servi touche à ma question). Notre autre condition IV semble solide: l'admissibilité au projet et le service militaire effectif sont fortement et positivement corrélés.
Voici ma question. Il semble que vous obtiendrez un biais d'auto-sélection: peut-être que les enfants plus riches peuvent quitter le service au Vietnam, même si leurs numéros de brouillon sont appelés. (Si ce n'était pas vraiment le cas, faisons semblant pour ma question). Si cette auto-sélection crée un biais systémique au sein de notre échantillon, comment notre variable instrumentale répond-elle à ce biais? Faut-il restreindre notre champ d'inférence aux "types de personnes qui ne pouvaient pas échapper au projet?" Ou le IV sauve-t-il d'une manière ou d'une autre cette partie de notre inférence? Si quelqu'un pouvait expliquer comment cela fonctionne, je lui en serais très reconnaissant.