Identification causale et splines pénalisées

Je viens de recevoir un rejet d'un journal économique. Parmi les raisons invoquées pour le rejet figurent:

les avantages de l'utilisation de la méthode semi-paramétrique ne sont pas clairement mis en évidence par rapport à d'autres techniques plus simples avec une identification claire des relations causales

Il est certainement possible que j'aurais pu mieux motiver la méthodologie auprès d'un groupe d'économistes qui s'en tiennent généralement à l'OLS. Mais ai-je violé "l'identification propre"? Veuillez juger par vous-même et faites-moi savoir ce que vous en pensez:

Ma principale équation d'estimation est est continu, et sont binaires. Je peux supposer à juste titre que ce qui revient à dire que le coefficient sur est non conditionnel aux variables factices au niveau individuel («effets fixes» en langage économétrique). Quand je continue inclure la variable , je cherche simplement à l' hétérogénéité des effets de traitement estimés sur des gradients de . Donc, l'effet causal moyen du traitement

y_{i t} = α_{i} + β_{1} T_{i t} + f (\begin{array}{l} Z_{i t} \\ Z_{i t} \times T_{i t} \\ Z_{i t} \times T_{i t} \times X_{t} \end{array}) + β_{2} X_{t} + ϵ_{i t}

$y_{it} = \alpha_i + \beta_1 T_{it} + f\left(\begin{array}{l}Z_{it}\\ Z_{it} \times T_{it} \\ Z_{it}\times T_{it} \times X_t\end{array} \right) + \beta_2X_t + \epsilon_{it}$

Z

$Z$

X

$X$

T

$T$

E [ϵ | α, T] = 0

$E[\epsilon|\alpha,T] = 0$

T

$T$

Z

$Z$

Z

$Z$

T

$T$ est une moyenne de pour les différents niveaux de que j'observe.

{\hat{β}}_{1} + {\hat{f}}_{Z \times T}

$\hat\beta_1 + \hat f_{Z\times T}$

Z

$Z$

Le modèle est estimé par des splines quadratiques pénalisées (par exemple: Ruppert et al. 2003). Plus précisément:

y = β_{0} + X^{'} β + \sum_{1}^{p} (Z^{p})^{'} γ + \sum_{j = 1}^{# v a r s} \sum_{k = 1}^{# k n o t s_{j}} δ_{j k} ({(Z_{j} - κ_{j k})}^{p} \times (Z_{j} > κ_{j k})) + ϵ

$y = \beta_0 +X'\beta + \displaystyle\sum_{1}^p (Z^{p})'\gamma + \displaystyle\sum_{j=1}^{\#vars} \displaystyle\sum_{k=1}^{\# knots_j}\delta_{jk}\left(\left(Z_j - \kappa_{jk} \right)^p \times \left(Z_j > \kappa_{jk} \right)\right) + \epsilon$

Ceci est résolu par

[\begin{matrix} \hat{β} \\ \hat{γ} \\ \hat{δ} \end{matrix}] = (C^{'} C + λ^{2 p} D)^{- 1} C^{'} y

$\left[\begin{array}{c} \hat\beta\\ \hat\gamma \\ \hat \delta \\ \end{array}\right] = (C'C + \lambda^{2p}D)^{-1}C'y$

où inclut les termes paramétriques et les termes de noeud, et où la pénalité de crête s'applique uniquement aux termes de noeud et est choisie pour minimiser AIC. (Je ne peux pas rendre pleinement justice à la méthodologie - voir Ruppert et al, ou le manuel de Simon Wood sur GAM). $C$ $\lambda$

Bien sûr, j'utilise ces semi-paramètres car je ne veux pas imposer de formes fonctionnelles infondées à mes données. Cela fausserait tout naturellement mes estimations autant qu'imposer un ajustement logarithmique à une fonction sinusoïdale fausserait mes estimations. Mais y a-t-il quelque chose d'inhérent aux splines pénalisées telles que je les ai décrites qui rendrait par essence la déclaration suivante fausse?

E [{\hat{β}}_{1}] = β_{1} iff E [ϵ | α, T] = 0

$E[\hat\beta_1] = \beta_1 \text{ iff } E[\epsilon|\alpha,T] = 0$

— utilisateur_générique
source

Je ne suis pas qualifié pour répondre à votre dernière question (bien que cela semble suspect), mais peut-être pour répondre aux préoccupations des revues, vous devriez également inclure un modèle OLS dans votre article et montrer qu'il fonctionne mal selon certaines mesures?

— thebigdog

Vous n'avez pas enfreint "l'identification propre". Il n'y a rien d'inhérent qui rend le modèle semi-paramétrique moins capable de réaliser une identification propre. En effet, votre modèle englobe un modèle linéaire.

@generic_user avez-vous déjà reçu une résolution à ce sujet? Si oui, pouvez-vous répondre à votre question? Sinon, pourriez-vous fournir une définition de l'identification propre? J'ai quelques perspectives sur la publication d'analyses ajustées à la spline qui peuvent ou non être pertinentes dans ce cas.

— AdamO

En retard à la fête, mais je pense que vous vous inquiétez de la mauvaise chose ici. Les arbitres disent qu'ils n'aiment pas que vous ajoutiez de la complexité sans prouver que c'est utile. Un exemple montrant un mode de défaillance de leurs méthodes simples de référence aiderait à motiver la complexité supplémentaire que vous introduisez. Il devrait être possible de déterminer (ou mieux de trouver un exemple réel) où les splines sont nécessaires pour identifier correctement une relation causale.

— Paul

Si cela a été publié à un moment donné, pouvez-vous s'il vous plaît mentionner le nom de l'article? Cela semble être une application intéressante.

— usεr11852

L '«identification propre» des paramètres de régression n'est pas un concept établi. Je crois que ce que le critique veut dire par là, c'est que vous devez spécifier un paramètre qui est interprétable, testable, de faible dimensionnalité, et pour lequel l'analyse est décemment alimentée pour détecter afin qu'une estimation impartiale puisse être obtenue avec une efficacité relativement bonne.

Le désir d'une «identification propre» n'implique pas que l'OLS soit le seul outil approprié pour le travail. OLS est, cependant, un outil théoriquement et pratiquement solide pour spécifier et estimer les paramètres dans une variété de paramètres. Le désir d'une "identification propre" n'exclut pas non plus l'inférence semi-paramétrique. Comme note, la spline étend un modèle OLS en créant (a) une ou des représentations complexes de covariables. L'inférence semi-paramétrique implique une modélisation flexible pour éliminer l'influence des statistiques auxiliaires, mais dans votre modèle, il semble que l'exposition principale soit gérée de cette manière.

Je pense que l'examinateur soulève deux préoccupations fondées. La première est la justification de la pénalisation. Les méthodes de régression pénalisées sont précieuses pour la prédiction. Ils sont rarement utilisés pour l'inférence. Les méthodes pénalisées comme la régression des crêtes sont biaisées et il est difficile de décrire ou d'évaluer le biais. Le but de minimiser l'AIC est d'obtenir les meilleures prédictions, et non une inférence valide. La deuxième préoccupation justifiée est de savoir si la spline est même nécessaire pour modéliser l'exposition principale. Il est vrai que vous dites qu'une spline est capable de modéliser des formes fonctionnelles non linéaires complexes. Cependant, une spline simplifie très peu. Il s'agit d'une représentation complexe de haute dimension, avec des nœuds et des réglages qui peuvent être une source de biais pour les chercheurs, et des covariables qui sont presque ininterprétables pour quiconque, sauf les statisticiens hautement qualifiés. De nombreuses tendances statistiquement significatives qui sont modélisées avec précision par des splines ont des approximations linéaires sous-jacentes qui ne sont ni statistiquement ni pratiquement significatives.

Si la forme fonctionnelle de l'exposition principale est mal spécifiée, il est possible d'utiliser les erreurs standard de Huber White pour obtenir une inférence cohérente et non biaisée pour la pente des moindres carrés comme approximation de premier ordre de toute tendance non linéaire. Les splines peuvent être utilisées pour modéliser des variables de précision, sur lesquelles vous ne basez pas d' inférence, lorsqu'il existe une conception complexe des données. Cela permet de faire correspondre et de réduire efficacement la variabilité lorsqu'il existe une hétérogénéité complexe dans les données.

Je pense que les commentaires des examinateurs peuvent être traités en ajustant un modèle linéaire pour l'exposition et en effectuant une inférence avec les erreurs de Huber White Sandwich. Si l'inférence est en grande partie d'accord avec l'inférence spline, commentez le modèle spline dans la mesure où il montre une tendance curviligne entre l'exposition et la réponse.

— AdamO
source