La médiane 2SLS juste identifiée est-elle impartiale?

Dans Mostly Harmless Econometrics: An Empiricist's Companion (Angrist et Pischke, 2009: page 209), je lis ce qui suit:

(...) En fait, le 2SLS (par exemple, l'estimateur Wald simple) qui vient d'être identifié est approximativement sans biais . Ceci est difficile à montrer formellement parce que le 2SLS juste identifié n'a pas de moments (c'est-à-dire que la distribution d'échantillonnage a des queues grasses). Néanmoins, même avec des instruments faibles, le 2SLS qui vient d'être identifié est approximativement centré où il devrait être. Nous disons donc que le 2SLS qui vient d'être identifié est sans biais médian. (...)

Bien que les auteurs disent que le 2SLS qui vient d'être identifié est sans biais médian, ils ne le prouvent pas et ne fournissent pas de référence à une preuve . À la page 213, ils mentionnent à nouveau la proposition, mais sans référence à une preuve. De plus, je ne trouve aucune motivation pour la proposition dans leurs notes de cours sur les variables instrumentales du MIT , page 22.

La raison peut être que la proposition est fausse car ils la rejettent dans une note sur leur blog . Cependant, le 2SLS juste identifié est approximativement sans biais médian, écrivent-ils. Ils motivent cela à l'aide d'une petite expérience de Monte-Carlo, mais ne fournissent aucune preuve analytique ou expression sous forme fermée du terme d'erreur associé à l'approximation. Quoi qu'il en soit, c'était la réponse des auteurs au professeur Gary Solon de la Michigan State University qui a fait le commentaire que le 2SLS qui vient d'être identifié n'est pas sans biais médian.

Question 1: Comment prouvez-vous que le 2SLS juste identifié n'est pas sans biais médian comme le soutient Gary Solon?

Question 2: Comment prouvez-vous que le 2SLS juste identifié est approximativement sans biais médian comme le soutient Angrist et Pischke?

Pour la question 1, je recherche un contre-exemple. Pour la question 2, je recherche (principalement) une preuve ou une référence à une preuve.

Je recherche également une définition formelle de la médiane sans biais dans ce contexte. Je comprends le concept comme suit: Un estimateur de basé sur un certain ensemble de variables aléatoires est médiane sans biais pour si et seulement si la distribution de a une médiane . $\hat{\theta}(X_{1:n})$ $\theta$ $X_{1:n}$ $n$ $\theta$ $\hat{\theta}(X_{1:n})$ $\theta$

Remarques

Dans un modèle qui vient d'être identifié, le nombre de régresseurs endogènes est égal au nombre d'instruments.
Le cadre décrivant un modèle de variables instrumentales qui vient d'être identifié peut être exprimé comme suit: Le modèle causal d'intérêt et l'équation de première étape est où est un matrice décrivant régresseurs endogènes, et où les variables instrumentales est décrit par un matrice . Ici
$\begin{matrix} (1) & {\begin{cases} Y & = X β + W γ + u \\ X & = Z δ + W ζ + v \end{cases} \end{matrix}$ $\begin{cases} Y&=X\beta+W\gamma+u \\ X&=Z\delta+W\zeta+v \end{cases}\tag{1}$ $X$ $k\times n+1$ $k$ $k\times n+1$ $Z$ $W$ décrit simplement un certain nombre de variables de contrôle (par exemple, ajoutées pour améliorer la précision); et et sont des termes d'erreur. $u$ $v$
Nous estimons dans à l' aide de 2SLS: Tout d' abord, la régression sur contrôle pour et acquérir les valeurs prédites ; c'est ce qu'on appelle la première étape. D' autre part, la régression sur contrôle pour ; c'est ce qu'on appelle la deuxième étape. Le coefficient estimé de dans la deuxième étape est nos 2SLS estimation de . $\beta$ $(1)$ $X$ $Z$ $W$ $\hat{X}$ $Y$ $\hat{X}$ $W$ $\hat{X}$ $\beta$
Dans le cas le plus simple, nous avons le modèle et instrumentons le régresseur endogène avec . Dans ce cas, l'estimation de 2SLS de est
$y_{i} = α + β x_{i} + u_{i}$ $y_i=\alpha+\beta x_i+u_i$ $x_i$ $z_i$ $\beta$ oùreprésente la covariance échantillon entreet. On peut simplifier: $\begin{matrix} (2) & {\hat{β}}^{2SLS} = \frac{s_{Z Y}}{s_{Z X}}, \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{s_{ZY}}{s_{ZX}}\tag{2},$ $s_{AB}$ $A$ $B$ $(2)$ où,et, oùest le nombre d'observations. $\begin{matrix} (3) & {\hat{β}}^{2SLS} = \frac{\sum_{i} (y_{i} - \bar{y}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} = β + \frac{\sum_{i} (u_{i} - \bar{u}) z_{i}}{\sum_{i} (x_{i} - \bar{x}) z_{i}} \end{matrix}$ $\hat{\beta}^{\text{2SLS}}=\frac{\sum_i(y_i-\bar{y})z_i}{\sum_i(x_i-\bar{x})z_i}=\beta+\frac{\sum_i(u_i-\bar{u})z_i}{\sum_i(x_i-\bar{x})z_i}\tag{3}$ $\bar{y}=\sum_iy_i/n$ $\bar{x}=\sum_i x_i/n$ $\bar{u}=\sum_i u_i/n$ $n$
J'ai effectué une recherche documentaire en utilisant les mots «juste identifié» et «sans biais médian» pour trouver des références répondant aux questions 1 et 2 (voir ci-dessus). Je n'en ai trouvé aucun. Tous les articles que j'ai trouvés (voir ci-dessous) font référence à Angrist et Pischke (2009: page 209, 213) lorsqu'ils déclarent que le 2SLS qui vient d'être identifié est sans biais médian.
- Jakiela, P., Miguel, E. et Te Velde, VL (2015). Vous l'avez mérité: estimer l'impact du capital humain sur les préférences sociales. Experimental Economics , 18 (3), 385-407.
- An, W. (2015). Estimations des variables instrumentales des effets des pairs dans les réseaux sociaux. Recherche en sciences sociales , 50, 382-394.
- Vermeulen, W. et Van Ommeren, J. (2009). L'aménagement du territoire façonne-t-il les économies régionales? Une analyse simultanée de l'offre de logements, des migrations internes et de la croissance de l'emploi local aux Pays-Bas. Journal of Housing Economics , 18 (4), 294-310.
- Aidt, TS et Leon, G. (2016). La fenêtre d'opportunité démocratique: preuves des émeutes en Afrique subsaharienne. Journal of Conflict Resolution , 60 (4), 694-717.

— Elias
source

Je n'ai pas pu répondre à cela avec une preuve formelle mais plutôt avec des études de simulation montrant que LIML est sans biais médian (plus la définition) et que LIML et 2SLS avec une variable endogène et un instrument ont la même petite distribution d'échantillons (donc si LIML dans ce le cas est non médian alors 2SLS aussi). Serait-ce suffisant pour répondre à votre question?

— Andy

@Andy Ce serait une très bonne réponse! Peut-être suffisant, selon ce que les autres utilisateurs peuvent dire. C'est probablement suffisant car je pense qu'il n'y a aucune preuve de la proposition selon laquelle le 2SLS juste identifié est approximativement sans médiane. Ce serait bien avec un contre-exemple montrant que le 2SLS juste identifié n'est cependant pas sans médiane; mais je pense qu'il est possible (mais peut-être difficile) de trouver moi-même un contre-exemple.

— Elias

Par approximativement sans biais, voulez-vous dire que le biais passe à zéro en fonction du nombre d'observations, comme 1 / n ou 1 / n ^ 2, etc.?

— Igor

@Igor L'expression "approximativement sans biais médian" n'est pas utilisée par moi. Étant donné que je ne sais pas ce que signifie «sans biais médian», je ne peux pas répondre à votre question. Mais vous semblez penser à un estimateur asymptotiquement non biaisé.

— Elias

Dans les études de simulation, le terme biais médian fait référence à la valeur absolue des écarts d'un estimateur par rapport à sa valeur réelle (que vous connaissez dans ce cas, car il s'agit d'une simulation, vous choisissez donc la vraie valeur). Vous pouvez voir un document de travail de Young (2017) qui définit le biais médian comme celui-ci dans le tableau 15, ou Andrews et Armstrong (2016) qui tracent des graphiques de biais médians pour différents estimateurs dans la figure 2.

Une partie de la confusion (également dans la littérature) semble provenir du fait qu'il existe deux problèmes sous-jacents distincts:

instruments faibles
de nombreux instruments (potentiellement) faibles

Le problème d'avoir un instrument faible dans un cadre qui vient d'être identifié est très différent de celui de nombreux instruments où certains sont faibles, cependant, les deux problèmes se confondent parfois.

$\kappa$

\hat{β} = {[X^{'} (I - κ M_{Z}) X]}^{- 1} [X^{'} (I - κ M_{Z})_{y})]

$\widehat{\beta} = \left[ X'(I-\kappa M_Z)X \right]^{-1}\left[ X'(I-\kappa M_Z)_y) \right]$

$M_Z = I-Z(Z'Z)^{-1}Z'$

\begin{aligned} y & = X β + u \\ X & = Z π + e . \end{aligned}

$\begin{align} y &= X\beta + u \\ X &= Z\pi + e. \end{align}$

$\kappa$ $\kappa = 0$ $\kappa = 1$ $\kappa$ $\det (X'X - \kappa X'M_ZX))=0$

De manière asymptotique, LIML et 2SLS ont la même distribution, cependant, dans de petits échantillons, cela peut être très différent. C'est particulièrement le cas lorsque nous avons de nombreux instruments et que certains sont faibles. Dans ce cas, LIML fonctionne mieux que 2SLS. LIML ici s'est avéré être sans biais médian. Ce résultat provient d'un tas d'études de simulation. Habituellement, les articles indiquant ce résultat se réfèrent à Rothberg (1983) «Propriétés asymptotiques de certains estimateurs dans les modèles structurels», Sawa (1972) ou Anderson et al. (1982) .

Steve Pischke fournit une simulation de ce résultat dans ses notes de 2016 sur la diapositive 17, montrant la distribution d'OLS, LIML et 2SLS avec 20 instruments dont un seul est réellement utile. La vraie valeur du coefficient est 1. Vous voyez que LIML est centré sur la vraie valeur tandis que 2SLS est biaisé vers OLS.

Maintenant, l'argument semble être le suivant: étant donné que LIML peut être montré comme étant sans biais médian et que dans le cas qui vient d'être identifié (une variable endogène, un instrument) LIML et 2SLS sont équivalents, 2SLS doit également être sans biais médian.

Cependant, il semble que les gens confondent à nouveau le cas des "instruments faibles" et des "nombreux instruments faibles" parce que dans le cadre qui vient d'être identifié, LIML et 2SLS vont être biaisés lorsque l'instrument est faible. Je n'ai vu aucun résultat où il a été démontré que LIML est impartial dans le cas qui vient d'être identifié lorsque l'instrument est faible et je ne pense pas que ce soit vrai. Une conclusion similaire ressort de la réponse d'Angrist et Pischke (2009) à Gary Solo à la page 2, où ils simulent le biais de OLS, 2SLS et LIML lors du changement de la force de l'instrument.

Pour de très petits coefficients de premier niveau <0,1 (en maintenant l'erreur standard fixe), c'est-à-dire une faible force de l'instrument, le 2SLS juste identifié (et donc le LIML juste identifié) est beaucoup plus proche de la limite de probabilité de l'estimateur OLS par rapport au valeur réelle du coefficient de 1.

Une fois que le coefficient du premier stade est compris entre 0,1 et 0,2, ils notent que la statistique F du premier stade est supérieure à 10 et qu'il n'y a donc plus de problème d'instrument faible selon la règle empirique de F> 10 de Stock et Yogo (2005). En ce sens, je ne vois pas comment LIML est censé être une solution pour un problème d'instrument faible dans le cas qui vient d'être identifié. Notez également que i) LIML a tendance à être plus dispersé et nécessite une correction de ses erreurs standard (voir Bekker, 1994) et ii) si votre instrument est réellement faible, vous ne trouverez rien dans la deuxième étape ni avec 2SLS ni LIML parce que les erreurs standard vont être trop importantes.

— Andy
source

Merci d'avoir répondu! Cela m'a rendu tout plus clair.

— Elias