Set-up
Supposons que vous ayez une régression simple de la forme
où les résultats sont les logarithmes des gains personne i , S i est le nombre d'années de scolarité, et e i est un terme d'erreur. Au lieu d'examiner uniquement l'effet moyen de l'éducation sur les revenus, que vous obtiendriez via OLS, vous souhaitez également voir l'effet sur différentes parties de la distribution des résultats.
dansyje= α + βSje+ ϵje
jeSjeεje
1) Quelle est la différence entre les conditions conditionnelle et inconditionnelle?
Commencez par tracer le logarithme des gains et choisissons deux individus, et B , où A se situe dans la partie inférieure de la répartition des gains non conditionnels et B dans la partie supérieure.
UNEBUNEB
Cela ne semble pas très normal mais c'est parce que je n'ai utilisé que 200 observations dans la simulation, alors ne vous en faites pas. Maintenant que se passe-t-il si nous conditionnons nos gains en années d’éducation? Pour chaque niveau d’éducation, vous obtiendrez une distribution des revenus "conditionnelle", c’est-à-dire que vous obtiendrez un graphique de densité comme ci-dessus, mais pour chaque niveau d’enseignement séparément.
UNEBUNE
Donc, une fois que vous conditionnez une autre variable, il est maintenant arrivé qu'une personne se trouve maintenant dans la partie supérieure de la distribution conditionnelle, alors que cette personne se trouverait dans la partie inférieure de la distribution inconditionnelle - c'est ce qui modifie l'interprétation des coefficients de régression quantile . Pourquoi?
E[ yje| Sje] = E[ yje]Qτ( yje| Sje) ≠ Qτ( yje)τ. Cela peut être résolu en effectuant d’abord la régression conditionnelle du quantile, puis en intégrant les variables de conditionnement afin d’obtenir l’effet marginalisé (l’effet inconditionnel) que vous pouvez interpréter comme dans MLS. Powell (2014) fournit un exemple de cette approche .
2) Comment interpréter les coefficients de régression quantile?
C'est la partie la plus délicate et je ne prétends pas posséder toutes les connaissances du monde à ce sujet, alors peut-être que quelqu'un propose une meilleure explication à ce sujet. Comme vous l'avez vu, le rang d'une personne dans la répartition des revenus peut être très différent selon que vous considérez la répartition conditionnelle ou inconditionnelle.
β90= 0,13
Régression quantile inconditionnelle
Celles-ci ressemblent aux coefficients OLS que vous avez l'habitude d'interpréter. La difficulté ici n’est pas l’interprétation mais la façon d’obtenir ces coefficients, ce qui n’est pas toujours facile (l’intégration peut ne pas fonctionner, par exemple avec des données très rares). D'autres méthodes de marginalisation des coefficients de régression quantile sont disponibles, telles que la méthode de Firpo (2009) utilisant la fonction d'influence recentrée. Le livre de Angrist et Pischke (2009) mentionné dans les commentaires indique que la marginalisation des coefficients de régression quantile est toujours un domaine de recherche actif en économétrie - bien que, à ma connaissance, la plupart des gens se contentent de la méthode d'intégration (un exemple serait Melly et Santangelo (2015) qui l'appliquent au modèle Changes-in-Changes).
3) Les coefficients de régression des quantiles conditionnels sont-ils biaisés?
Non (si vous avez un modèle correctement spécifié), ils mesurent simplement quelque chose de différent qui pourrait vous intéresser ou non. Un effet estimé sur une distribution plutôt que sur des individus est, comme je l'ai dit, peu intéressant - la plupart du temps. Pour donner un exemple contraire, considérons un décideur qui introduit une année supplémentaire de scolarité obligatoire et qui veut savoir si cela réduit l’inégalité des revenus de la population.
βτβdix= β90= 0,8
Lorsque l'effet de traitement quantile n'est PAS constant (comme dans les deux panneaux du bas), vous disposez également d'un effet d'échelle en plus de l'effet de localisation. Dans cet exemple, le bas de la répartition des gains augmente plus que le haut, de sorte que le différentiel 90-10 (mesure standard de l'inégalité des gains) diminue dans la population.
Vous ne savez pas quelles personnes en bénéficient ni dans quelle partie de la distribution sont les personnes qui ont commencé par le bas (pour répondre à CETTE question, vous avez besoin des coefficients de régression quantiles inconditionnels). Peut-être que cette politique les blesse et les place dans une partie encore plus basse par rapport à d’autres mais si l’objectif était de savoir si une année supplémentaire de scolarité obligatoire réduirait l’écart des revenus, alors c’est instructif. Un exemple d'une telle approche est Brunello et al. (2009) .
Si vous êtes toujours intéressé par le biais des régressions de quantiles en raison de sources d'endogénéité, consultez Angrist et al (2006), où ils calculent une formule de biais de variable omise pour le contexte du quantile.