Spécification d'un modèle de différence dans les différences avec plusieurs périodes

20

Lorsque j’estime un modèle de différence dans les différences avec deux périodes, le modèle de régression équivalent serait

une. $Y_{ist} = \alpha +\gamma_s*Treatment + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist}$

où est un mannequin qui est égal à 1 si l'observation provient du groupe de traitement $Treatment$
et est un mannequin qui est égal à 1 dans la période de temps après le traitement $d$

Ainsi, l'équation prend les valeurs suivantes.

Groupe témoin, avant traitement: $\alpha$
Groupe témoin, après traitement: $\alpha +\lambda$
Groupe de traitement, avant traitement: $\alpha +\gamma$
Groupe de traitement, après traitement: $\alpha+ \gamma+ \lambda+ \delta$

Par conséquent, dans un modèle à deux périodes, la différence d'estimation des différences est $\delta$ .

Mais que se passe- il concernant si j'ai plus d'une période de pré et post traitement? Dois-je toujours utiliser un mannequin qui indique si un an est avant ou après le traitement? $d_t$

Ou dois-je ajouter des variables muettes à la place sans préciser si chaque année appartient à la période de pré ou post-traitement? Comme ça:

b. $Y_{ist} = \alpha +\gamma_s*Treatment + yeardummy + \delta*(Treatment*d_t)+ \epsilon_{ist}$

Ou puis-je inclure les deux (c'est-à-dire )? $yeardummy +\lambda d_t$

c. $Y_{ist} = \alpha +\gamma_s*Treatment + yeardummy + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist}$

En conclusion, comment spécifier un modèle de différence de différences avec plusieurs périodes (a, b ou c)?

— À M
source

1

Vous utilisez généralement le modèle b. Notez que dans le modèle c,

sera parfaitement colinéaire avec les variables muettes de l'année, de sorte que le modèle ne peut pas être estimé.

d_{t}

$d_t$

— standard_error

Ce serait formidable si vous pouviez expliquer pourquoi b est généralement utilisé. Peut-être donner quelques références, ou simplement donner une explication de 2 phrases.

— mpiktas

et dans le modèle b. pourriez-vous ajouter une variable continue pour l'année au lieu de variables muettes? En quoi l'interprétation des coefficients différerait-elle dans ces cas?

19

La manière typique d'estimer un modèle de différence dans les différences avec plus de deux périodes est votre solution proposée b). En conservant votre notation, vous régresseriez où est une variable fictive qui est égal à un pour les unités de traitement

Y_{i s t} = α + γ_{s} ({Treatment}_{s}) + λ ({year dummy}_{t}) + δ D_{s t} + ϵ_{i s t}

$Y_{ist} = \alpha +\gamma_s (\text{Treatment}_s) + \lambda (\text{year dummy}_t) + \delta D_{st} + \epsilon_{ist}$

D_{t} \equiv {Treatment}_{s} \cdot d_{t}

$D_t \equiv \text{Treatment}_s\cdot d_t$

s

$s$ dans la période de post-traitement (

) et est nul sinon. Il convient de noter qu'il s'agit d'une formulation plus générale de la régression des différences de différences qui permet différents moments du traitement pour différentes unités traitées.

d_{t} = 1

$d_t = 1$

Comme cela a été correctement souligné dans les commentaires, votre solution c) proposée ne fonctionne pas en raison de la colinéarité avec les variables temporelles et la variable factice pour la période de post-traitement. Cependant, une légère variante de ceci s'avère être un contrôle de robustesse. Soit et deux ensembles de variables muettes pour chaque unité de contrôle et chaque unité traitée , respectivement, puis en interagissant les variables muettes pour les unités traitées avec la variable de temps et en régressant $\gamma_{s0}$ $\gamma_{s1}$ $s0$ $s1$ $t$

Y_{i s t} = γ_{s 0} + γ_{s 1} t + λ ({year dummy}_{t}) + δ D_{s t} + ϵ_{i s t}

$Y_{ist} = \gamma_{s0} + \gamma_{s1}t + \lambda (\text{year dummy}_t) + \delta D_{st} + \epsilon_{ist}$

γ_{s 1} t

$\gamma_{s1}t$

δ

$\delta$

Un exemple cité dans Angrist et Pischke (2009) Mostly Harmless Econometrics est une étude de politique du marché du travail de Besley et Burgess (2004) . Dans leur article, il arrive que l'inclusion de tendances temporelles spécifiques à l'État tue l'effet estimé du traitement. Notez cependant que pour cette vérification de robustesse, vous avez besoin de plus de 3 périodes.

— Andy
source

A follow up since I am trying to decide if implementing this with some administrative data is appropriate: Would you say a DD approach is more valid than a CITS design if there are only 4 time points (2 pre and 2 post) in a model? Also, if I have multiple cohorts within waves of data should these be examine separately or in a unified model? Thanks.

— bfoste01

@Andy: Can you pls explain, what you mean by s0, s1, and unit-specific time trend? Assuming I have two newspapers (WPT and NYT) and WPT is my treatement group, which of them would be s0 and s1?

— user3683131

1

Ai-je raison de penser que cette analyse compare le traitement moyen avant et après traitement et ne tient pas compte des tendances séculaires? c'est-à-dire si d_t = 0 pour toutes les périodes de temps avant le point de commutation, et d_t = 1 pour toutes les périodes de temps après, alors cette analyse est essentiellement la même que les deux périodes de temps une, sauf que la moyenne est prise de tout le temps avant / après périodes. Les tendances temporelles des résultats avant / après le changement de traitement sont-elles ignorées? J'essaie de décider si un modèle DiD est correct pour une analyse que je prévois de réaliser.

— 30

0

Je voudrais clarifier quelque chose (et répondre indirectement à une question dans les commentaires). Elle concerne en particulier l'utilisation de tendances temporelles linéaires spécifiques à l'unité. À titre de vérification de la robustesse, il semblerait que vous n'interagissiez que pour les unités traitées (c.-à-d. $\gamma_{1s}$ ) avec une tendance temporelle continue. Cependant, il est en fait vrai que vous interagissez avec un ensemble complet de variables indicatrices d'unités / états (effets fixes d'unités / états) avec une variable de tendance temporelle linéaire.

Angrist et Pischke (2009) recommandent cette approche à la page 238 de l' économétrie Mostly Harmless . Les différences de notation peuvent prêter à confusion. Reproduction de la spécification 5.2.7:

y_{i s t} = γ_{0 s} + γ_{1 s} t + λ_{t} + δ D_{s t} + X_{i s t}^{^{'}} β + ε_{i s t},

$y_{ist} = \gamma_{0s} + \gamma_{1s} t + \lambda_{t} + \delta D_{st} + X^{'}_{ist}\beta + \varepsilon_{ist},$

where $\gamma_{0s}$ is a state-specific intercept, in accordance with the $s$ subscript used in their book. You can view $\gamma_{1s}$ as the state-specific trend coefficient multiplying the time trend variable, $t$ . Different papers use different notation. For example, Wolfers (2006) replicates a model incorporating state-specific linear time trends. Reproducing model (1):

y_{s, t} = \sum_{s} S t a t e_{s} + \sum_{t} Y e a r_{t} + \sum_{s} S t a t e_{s} * T i m e_{t} + δ D_{s, t} + ε_{s, t},

$y_{s,t} = \sum_{s} State_{s} + \sum_{t} Year_{t} + \sum_{s} State_{s}*Time_{t} + \delta D_{s,t} + \varepsilon_{s,t},$

where the model includes state and year fixed effects (i.e., dummies for each state and year). The treatment variable $D_{s,t}$ is when state $s$ adopts a unilateral divorce regime in period $t$ . Notice this specification interacts state dummies with a linear time trend (i.e., $Time_{t}$ ). This is yet another representation of state-specific linear time trends in your model specification.

Unit-specific linear time trends is also addressed in another post (see below):

How to account for endogenous program placement?

In sum, you want to interact all unit (group) dummies with a continuous time trend variable.

Paper by Justin Wolfers is below for your reference:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

— Tom
source