Comment les variables instrumentales répondent-elles au biais de sélection?

Je me demande comment une variable instrumentale aborde le biais de sélection dans la régression.

Voici l'exemple que je mâche: dans la plupart des économétries inoffensives , les auteurs discutent d'une régression IV relative au service militaire et aux gains plus tard dans la vie. La question est: "Est-ce que le fait de servir dans l'armée augmente ou diminue les gains futurs?" Ils enquêtent sur cette question dans le contexte de la guerre du Vietnam. Je comprends que le service militaire ne peut pas être assigné au hasard et que c'est un problème d'inférence causale.

Pour résoudre ce problème, le chercheur utilise le projet d'admissibilité (comme dans «votre numéro de projet s'appelle») comme instrument pour le service militaire réel. Cela a du sens: le projet du Vietnam a affecté au hasard de jeunes hommes américains aux forces armées (en théorie - si les recrues ont effectivement servi touche à ma question). Notre autre condition IV semble solide: l'admissibilité au projet et le service militaire effectif sont fortement et positivement corrélés.

Voici ma question. Il semble que vous obtiendrez un biais d'auto-sélection: peut-être que les enfants plus riches peuvent quitter le service au Vietnam, même si leurs numéros de brouillon sont appelés. (Si ce n'était pas vraiment le cas, faisons semblant pour ma question). Si cette auto-sélection crée un biais systémique au sein de notre échantillon, comment notre variable instrumentale répond-elle à ce biais? Faut-il restreindre notre champ d'inférence aux "types de personnes qui ne pouvaient pas échapper au projet?" Ou le IV sauve-t-il d'une manière ou d'une autre cette partie de notre inférence? Si quelqu'un pouvait expliquer comment cela fonctionne, je lui en serais très reconnaissant.

— ConfusedEconometricsUndergrad
source

En fait, la question du biais de sélection est la motivation initiale de l'utilisation des instruments. La question ici est de savoir si le tirage au sort aléatoire contourne ce problème. Vous avez parfaitement raison de demander: quelles sont les limites de cet instrument? Si en effet les enfants riches avaient de meilleures chances d'éviter le projet, alors l'effet négatif du service sur les revenus ultérieurs sera surestimé en termes absolus.

Il y avait d'autres moyens de sortir du projet, par exemple en raison d'une mauvaise santé. Ou, au contraire, il était connu parmi les candidats potentiels que le bénévolat plutôt que d'être rédigé par la loterie se traduisait par de meilleurs placements et conditions de service. Par conséquent, les personnes dont les numéros de loterie étaient plus susceptibles d'être rédigés choisissaient souvent de faire du bénévolat à la place. Si un tel comportement d'évitement mine le processus de randomisation d'une manière que vous décrivez, alors nos estimations 2SLS seront toujours biaisées. Rétrécir l'échantillon à ceux qui n'ont pas échappé au brouillon ne vous aide pas dans ce cas car la randomisation du traitement n'est pas réellement aléatoire.
Cependant, si le non-respect du traitement est encore aléatoire ou non significatif en moyenne, les numéros de loterie peuvent toujours être utilisés comme un instrument. Dans ce cas, votre instrument pour le service militaire est l'intention de traiter (ITT, voir le chapitre correspondant dans le livre d'Angrist et Pischke). Donc, le point important est que s'il y a non-conformité pour une raison quelconque, nous devons montrer que cela n'invalide pas la randomisation. Ensuite, cet instrument est ok, sinon nous ne pouvons pas l'utiliser.

Il existe plusieurs façons de tester cela. Vous pouvez régresser l'instrument sur des caractéristiques personnelles qui ne sont pas affectées par le traitement comme l'âge, la race, etc. qui sont déterminées avant que soit déterminé. Une autre vérification est de tester l'effet de l'instrument sur les résultats dans les échantillons sans relation entre et , comme les bénévoles qui se sont portés volontaires avant d' avoir reçu un projet de numéro de loterie. L'idée est que si la seule raison pour laquelle votre numéro de loterie affecte vos gains ultérieurs est le statut de service, alors l'ébauche d'éligibilité ne devrait avoir aucun effet sur les gains dans les échantillons où elle n'est pas liée au statut de service. $Z_i$ $D_i$ $D_i$ $D_i$ $Z_i$

Angrist (1990) effectue certaines de ces vérifications pour répondre à votre préoccupation. Malgré les préoccupations exprimées ci-dessus, il s'avère que le projet de loterie semble être un instrument solide. Berinsky (2010) fournit beaucoup plus de contrôles de randomisation et donne des informations supplémentaires sur l'historique de la loterie.

— Andy
source

Bonne réponse! Le refrain de la chanson de Phil Ochs Draft Dodger Rag répertorie les mécanismes possibles pour éviter le brouillon. J'ai toujours pensé que les vérifier aurait fait un papier amusant.

— Dimitriy V. Masterov

Merci! Cela rend tout beaucoup plus clair; Je vais également lire les journaux.

— ConfusedEconometricsUndergrad