Considérons le modèle de régression multiple suivant:
Ici, est un vecteur de colonne ; une matrice ; a vecteur de colonne; a matrice; a vecteur de colonne; et , le terme d'erreur, un vecteur de colonne .
QUESTION
Mon conférencier, le manuel Introduction to Econometrics, 3e éd. par James H. Stock et Mark W. Watson, p. 281 et Econometrics: Honor's Exam Review Session (PDF) , p. 7, m'a exprimé ce qui suit.
- Si nous supposons ce qu'on appelle l' indépendance moyenne conditionnelle , ce qui signifie par définition que
et si l'hypothèse des moindres carrés est satisfaite, sauf l'hypothèse de moyenne zéro conditionnelle (nous supposons donc ) (voir 1 -3 ci-dessous),
ensuite, l'estimateur OLS de in reste sans biais et cohérent, sous cet ensemble plus faible d'hypothèses.
Comment prouver cette proposition? C'est-à-dire que 1 et 2 ci-dessus impliquent que l'estimation OLS de nous donne un estimateur sans biais et cohérent pour ? Existe-t-il un article de recherche prouvant cette proposition?
COMMENTAIRE
Le cas le plus simple est donné en considérant le modèle de régression linéaire et prouver que l'OLS estime of est sans biais si pour chaque .
PREUVE DE partons du principe que non biaisé ET SONT CONJOINTEMENT DISTRIBUE NORMALEMENT
Définissez , puis etAinsi peut être réécrit comme Par il s'ensuit alors que Or, comme et sont distribués normalement normalement conjointement, la théorie des distributions normales, cf. Dériver les distributions conditionnelles d'une distribution normale multivariée , dit que (en effet, nous n'avons pas besoin de supposer une normalité conjointe mais seulement cette identité) pour certains vecteurs par
Maintenant devient Pour le modèle toutes les hypothèses des moindres carrés sont satisfaites, car le terme d'erreur satisfait l'hypothèse de conditionnel signifie zéro. Cela implique que l'estimation OLS de sera sans biais, car si nous laissons , et que soit le par matrice composée de et , alors l'estimation OLS de dans est donnée en considérant ce qui suit:
et ainsi où la deuxième ligne suit par . Ainsi, est une estimation conditionnellement non biaisée de puisque l'estimation OLS donnée pour le modèle coinicides avec celle donnée pour le modèle . Maintenant, selon la loi de l'attente totale et donc est un estimateur non biaisé pour .
(On peut noter que , de sorte que le coefficient sur n'est pas nécessairement sans biais.)
Cependant, le cas spécial ci-dessus suppose que et sont distribués normalement normalement conjointement, comment puis-je prouver la proposition sans cette hypothèse?
En supposant que suffit toujours bien sûr (cf. ), mais je suis censé dériver le résultat en utilisant simplement et l'hypothèse des moindres carrés excluant l'hypothèse du zéro moyen conditionnel ( voir ci-dessous).
CONCERNANT LA COHÉRENCE
Je pense que l'on peut également voir que l'estimation est cohérente pour en remarquant que dans le modèle de régression toutes les hypothèses des moindres carrés sont satisfaites, y compris l'hypothèse que le (nouveau) terme d'erreur satisfait le Hypothèse conditionnelle du zéro moyen (cf. et voir ci-dessous).
J'ajouterai plus tard une preuve de cohérence qui est basée sur une série d'exercices dans Introduction to Econometrics, 3e éd. par James H. Stock et Mark W. Watson, ch. 18. Cependant, cette preuve est assez longue. Mais le fait est que la preuve fournie dans les exercices suppose , donc je me demande toujours si l'hypothèse suffit vraiment.
SOUS-DEMANDE 1
Dans Introduction to Econometrics, 3e éd. par James H. Stock et Mark W. Watson, il est dit, à la p. 300, que l'hypothèse peut être "assouplie" en utilisant la théorie de la régression non linéaire. Que veulent ou peuvent-ils dire par là?
LES HYPOTHÈSES DES MOINS CARRÉS
Ici, j'exclus l'hypothèse de moyenne nulle conditionnelle selon laquelle puisque la proposition que nous essayons de prouver ici permet des cas où . Ce sont par exemple les cas où est en corrélation avec . Cf. Économétrie: Session d'examen de l'examen d'honneur (PDF) , p. 7.
L'hypothèse des moindres carrés est la suivante.
Les distributions conjointes de , sont iid, où est le : e élément dans et où et sont les : e vecteurs de ligne dans et .
Les grandes valeurs aberrantes sont peu probables, à savoir, pour chaque , et ont des moments finis quatrième, où est le : ième élément en .
a un rang de colonne complet (c'est-à-dire qu'il n'y a pas de multicolinéarité parfaite; cela garantit l'inversibilité de ).
( Hypothèses des moindres carrés étendus : bien que je ne pense pas que cela soit nécessaire (et il m'a été dit que ce n'est pas le cas), nous pouvons également supposer une homoskédasticité, c'est-à-dire pour chaque , et que la distribution conditionnelle de donnée est normale pour chaque (c'est-à-dire que nous avons des erreurs normales.))
NOTE SUR LA TERMINOLOGIE
Dans , l'hypothèse du zéro moyen conditionnel est l'hypothèse que . L'hypothèse d'indépendance moyenne conditionnelle, cependant, est l'hypothèse que .
Cette terminologie est utilisée par exemple dans Introduction to Econometrics, 3rd ed. par James H. Stock et Mark W. Watson, p. 281; and Econometric Analysis of Cross Section and Panel Data, 1ère éd. par Jeffrey M. Wooldridge, p. 607. Voir aussi Restrictions d'indépendance conditionnelles: tests et estimations pour des discussions similaires.
RÉFLEXIONS SUPPLÉMENTAIRES ET SOUS-REQUÊTE 2
Je pense que contrairement à James H. Stock et Mark W. Watson, l'indépendance moyenne conditionnelle ne garantit pas une estimation OLS non biaisée de . En effet, peut prendre des formes non linéaires comme où est un polynôme en , ou où est un paramètre encore à estimer (j'utilise ici la matrice exponentielle ), puis, je pense, une régression non linéaire doit être appliquée, ce qui nous laisse généralement des estimations biaisées. De plus, l'estimation OLS dans (1) de peut même ne pas coïncider avec l'estimation OLS deβ β ( 4 ) E ( U | Z )en si prend certaines formes non linéaires. (Psychologiquement, je pense également que la déclaration faite dans le livre de Stock & Watson est trop belle pour être vraie.)
Ainsi, une question supplémentaire est de savoir s'il existe un contre-exemple à la proposition selon laquelle l'indépendance moyenne conditionnelle conduit à une estimation OLS non biaisée?
SOUS-DEMANDE 3
Dans Mostly Harmless Econometrics, Angrist & Pischke fait valoir à la sous-section 3.3, p. 68 à 91, que sous l'indépendance conditionnelle (IC), c'est-à-dire que étant indépendant de étant donné (qui est une condition plus forte, je suppose, que l'hypothèse d'indépendance moyenne conditionnelle donnée ci-dessus), il existe un lien étroit entre les estimations correspondantes de l'effet de sur et des coefficients sur dans la régression de sur et ce qui motive que sous CI l'estimation OLS du coefficient sur dans est moins biaisé que si CI ne tient pas (toutes choses égales par ailleurs).
Maintenant, cette idée peut-elle être utilisée d'une manière ou d'une autre pour répondre à ma question principale ici?