Vous n'avez pas besoin d'hypothèses sur les 4èmes moments pour la cohérence de l'estimateur OLS, mais vous avez besoin d'hypothèses sur les moments supérieurs de et ϵ pour la normalité asymptotique et pour estimer de manière cohérente ce qu'est la matrice de covariance asymptotique.Xϵ
Dans un certain sens cependant, c'est un point mathématique, technique, pas un point pratique. Pour que OLS fonctionne bien dans des échantillons finis, dans un certain sens, il faut plus que les hypothèses minimales nécessaires pour atteindre la cohérence asymptotique ou la normalité comme .n → ∞
Conditions suffisantes pour la cohérence:
Si vous avez l'équation de régression:
yje= x′jeβ + ϵje
L'estimateur OLS b peut être écrit sous la forme:
b = β + ( X ' Xb^
b^= β + ( X′Xn)- 1( X′ϵn)
Par souci de cohérence , vous devez être en mesure d'appliquer la loi de Kolmogorov sur les grands nombres ou, dans le cas de séries chronologiques avec dépendance série, quelque chose comme le théorème ergodique de Karlin et Taylor afin que:
1nX′X→pE [ xjeX′je]1nX′ϵ →pE [ x′jeϵje]
Les autres hypothèses nécessaires sont:
- est de rang complet et donc la matrice est inversible.E [ xjeX′je]
- Les régresseurs sont prédéterminés ou strictement exogènes de sorte que .E [ xjeϵje] = 0
Alors et vous obtenez b p →ß( X′Xn)- 1( X′ϵn) →p0b^→pβ
Si vous voulez que le théorème de la limite centrale s'applique, alors vous avez besoin d'hypothèses sur les moments supérieurs, par exemple, où g i = x i ϵ i . Le théorème central limite est ce que vous donne la normalité asymptotique de b et vous permet de parler des erreurs standard. Pour que le deuxième moment E [ g i g ′ i ] existe, vous avez besoin des 4èmes moments de x et ϵ pour exister. Vous voulez faire valoir que √E [ gjeg′je]gje= xjeϵjeb^E [ gjeg′je]XϵoùΣ=E[xix ′ i ϵ 2 i ]. Pour que cela fonctionne,Σdoit être fini.n--√( 1n∑jeX′jeϵje) →réN( 0 , Σ )Σ = E [ xjeX′jeϵ2je]Σ
Une belle discussion (qui a motivé ce post) est donnée dans l' économétrie de Hayashi . (Voir aussi p. 149 pour les 4èmes moments et l'estimation de la matrice de covariance.)
Discussion:
Ces exigences sur les 4èmes moments sont probablement un point technique plutôt qu'un point pratique. Vous n'allez probablement pas rencontrer de distributions pathologiques où c'est un problème dans les données de tous les jours? C'est pour que les hypothèses les plus courantes ou d'autres OLS tournent mal.
Une autre question, sans aucun doute posée ailleurs sur Stackexchange, est la taille d'un échantillon dont vous avez besoin pour des échantillons finis afin de vous rapprocher des résultats asymptotiques. Il y a un certain sens dans lequel des valeurs aberrantes fantastiques conduisent à une convergence lente. Par exemple, essayez d'estimer la moyenne d'une distribution log-normale avec une variance très élevée. La moyenne de l'échantillon est un estimateur cohérent et non biaisé de la moyenne de la population, mais dans ce cas log-normal avec un excès de kurtosis fou, etc.
Fini et infini est une distinction extrêmement importante en mathématiques. Ce n'est pas le problème que vous rencontrez dans les statistiques quotidiennes. Les problèmes pratiques se situent davantage dans la catégorie petite vs grande. La variance, le kurtosis, etc. sont-ils suffisamment petits pour que je puisse obtenir des estimations raisonnables compte tenu de la taille de mon échantillon?
Exemple pathologique où l'estimateur OLS est cohérent mais pas asymptotiquement normal
Considérer:
yje= b xje+ ϵje
Xje∼ N( 0 , 1 )ϵjeV a r ( ϵje) = ∞bb^b^ basé sur 10000 simulations d'une régression avec 10000 observations.
b^ϵje
Code pour le générer:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));