Inclusion d'une variable dépendante décalée dans la régression


26

Je suis très confus quant à savoir s'il est légitime d'inclure une variable dépendante retardée dans un modèle de régression. Fondamentalement, je pense que si ce modèle se concentre sur la relation entre le changement de Y et d'autres variables indépendantes, l'ajout d'une variable dépendante décalée dans le côté droit peut garantir que le coefficient avant les autres IV est indépendant de la valeur précédente de Y.

Certains disent que l'inclusion du LDV biaisera à la baisse le coefficient des autres IV. Certains autres disent que l'on peut inclure le LDV, ce qui peut réduire la corrélation série.

Je sais que cette question est assez générale en termes de type de régression. Mais mes connaissances statistiques sont limitées et j'ai vraiment du mal à déterminer si je dois inclure une variable dépendante retardée dans un modèle de régression lorsque l'accent est mis sur le changement de Y au fil du temps.

Existe-t-il d'autres approches pour gérer l'influence des X sur le changement de Y au fil du temps? J'ai également essayé différents scores de changement en DV, mais le R au carré dans cette situation est très faible.


1
qu'espérez-vous réaliser avec votre modèle? Maximiser le R au carré est rarement un bon critère de sélection de modèle.
Michael Bishop

Ce modèle sera utilisé pour la prédiction. Il est vrai que bien que le R au carré diffère beaucoup, les valeurs prévues sont en fait les mêmes en utilisant Y ou le changement de Y. Cependant, étant donné la faible valeur du R au carré en utilisant le changement de Y comme DV, cela signifie-t-il que le l'ensemble actuel de IV n'est pas en mesure d'expliquer très bien le changement et il doit y avoir des variables omises?
user22109

Réponses:



12

Je recommande deux articles:

  1. Achen CH (2001) Pourquoi les variables dépendantes décalées peuvent supprimer le pouvoir explicatif d'autres variables indépendantes ( lien )
  2. Keele, L. et Kelly NJ (2005) Modèles dynamiques pour les théories dynamiques: les tenants et les aboutissants des variables dépendantes retardées ( lien ).

Le résultat est que l'inclusion d'une variable dépendante retardée peut avoir une grande influence sur les coefficients des variables restantes. Parfois, cela est approprié (pour les modèles dynamiques de Keele et Kelly) et parfois non. Comme d'autres l'ont dit, il est important de penser au processus modélisé.


4

L'inclusion de variables dépendantes décalées peut réduire l'occurrence d'autocorrélation résultant d'une erreur de spécification du modèle. Ainsi, la prise en compte des variables dépendantes retardées vous aide à défendre l'existence d'une autocorrélation dans le modèle. La valeur passée affecte le présent dans le modèle, nécessite une base théorique et ajuste le mieux le modèle selon les besoins.


Je ne suis pas sûr d'avoir rendu justice à la dernière phrase; veuillez modifier si le sens peut être clarifié. Bienvenue chez Cross Validated BTW!
Nick Stauner

1
L'autocorrélation peut être un artefact de la façon dont les données sont collectées. J'ai obtenu des données en numérisant un tracé, ce qui signifie que les données ont été triées. Ce tri et la relation non linéaire ont provoqué une autocorrélation dans les résidus.
Tony Ladson

2

Ce qui m'intrigue dans cette question, c'est de ne pas en savoir plus sur la spécification du modèle ou sa technique d'estimation. Je mentionne que parce que bien que l'utilisation d'un DV retardé parmi les IV puisse être théoriquement importante et méthodologiquement nécessaire, elle peut également introduire une quantité d'endongénéité risquée dans le modèle, en fonction de la relation substantielle entre les variables et les unités de temps et, également, sur l'AR qui peut exister dans le modèle. À moins que vous (et nous) n'ayez plus de détails sur les variables et sur l'estimation, je ne me sentirais pas à l'aise de recommander de retarder la DV à moins que vous ne pensiez à une technique de variable instrumentale ou quelque chose comme l'estimation Arellano-Bond.

Veuillez nous donner plus de détails afin que nous puissions mieux connaître le type de modèle dont nous parlons.


0

Oui, vous devez vous méfier du biais de Nickell dans une situation de petit T grand N (Nickell, S. (1981). Biais dans les modèles dynamiques à effets fixes. Econometrica: Journal of the Econometric Society, 1417-1426.)

Vous voudrez peut-être regarder les modèles Dynamic Panel Data comme les estimateurs Arellano-Bond ou Blundell-Bond.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.