Pour ceux qui ne connaissent pas l'extrait de code suivant de Stata, l'OP fourni
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
cette équation peut être lue comme
Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t−1)
Y~t−1
Y~t−1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)
(c.-à-d. que la première étape de l'équation IV se trouve entre parenthèses dans le code Stata)
Les deltas représentent des différences de deuxième, troisième et quatrième ordre, et ils sont utilisés comme instruments exclus pour estimer le décalage de la variable dépendante.
L.
t−1D.
D2.
Au début, je ne pouvais penser à aucun raisonnement logique pour lequel quelqu'un ferait cela. Mais Kwak a souligné (en se référant à cet article ) que la méthode Arellano-Bond utilise les différences comme instruments pour estimer la composante autorégressive du modèle. (En outre, j'avais initialement supposé que les différences n'auraient d'effet que si la série n'est pas stationnaire, ce que Bond déclare dans cet article lié, les différences ne seront que des instruments faibles dans le cas où la série est une marche aléatoire, à la p. 21 )
En tant que suggestions de lectures complémentaires comme introductions aux variables instrumentales,
Une autre affiche dans cette réponse (Charlie) liée à quelques diapositives qu'il a préparées et que je suggérerais mérite d'être examinée pour une introduction aux variables instrumentales. Je suggérerais également ce powerpoint qu'un de mes professeurs a préparé pour un atelier comme introduction. Comme dernière suggestion pour quiconque souhaite en savoir plus sur les variables instrumentales, vous devriez consulter le travail de Joshua Angrist.
Voici ma réponse initiale
L.
t−1D.
D2.
Dans toutes les applications que j'ai vues, les gens utilisent le retard des variables indépendantes comme instruments pour estimer le retard de la variable dépendante (pour des raisons dont parle ars). Mais cela est basé sur l'hypothèse que les variables indépendantes décalées sont exogènes au terme d'erreur dans la période pendant laquelle elles sont appliquées.
Je ne connais aucun raisonnement dans lequel les différences de la variable dépendante seraient considérées comme exogènes. Pour autant que je sache, ce n'est pas une pratique acceptée de ne faire la différence que d'un côté de l'équation, et cela produirait des résultats plutôt illogiques ( voici un article qui critique quelqu'un sur la situation inverse dans laquelle il a inclus un niveau de variables comme prédicteur de une série différenciée.) Si vous réorganisez les termes de l'équation IV, cela ressemble en fait à un test de Dickey Fuller augmenté.
Alors que la réponse la plus simple serait de demander à la personne qui a écrit le code, quelqu'un peut-il donner un exemple dans lequel cette procédure serait acceptable, ou une situation dans laquelle cette procédure retournerait des résultats significatifs? En l'état, je ne peux penser à aucun raisonnement logique pour lequel les différences auraient un effet sur les niveaux, sauf dans le cas où la série n'est pas stationnaire.