Quel est le lien entre un «modèle à effets aléatoires» en économétrie et des modèles mixtes extérieurs à l'économétrie?


56

J'avais l'habitude de penser que le "modèle à effets aléatoires" en économétrie correspond à un "modèle mixte avec interception aléatoire" en dehors de l'économétrie, mais je ne suis pas sûr à l'heure actuelle. Le fait-il?

L'économétrie utilise des termes tels que "effets fixes" et "effets aléatoires", ce qui diffère quelque peu de la littérature sur les modèles mixtes, ce qui engendre une confusion notoire. Considérons une situation simple où dépend linéairement de mais avec une interception différente dans différents groupes de mesures:yx

yit=βxit+ui+ϵit.

Ici, chaque unité / groupe est observé à différents moments . Les économétriciens appellent cela des "données de panel".it

  • Dans la terminologie des modèles mixtes, nous pouvons traiter comme un effet fixe ou aléatoire (dans ce cas, il s’agit d’une interception aléatoire). Le traiter comme fixe signifie ajuster et pour minimiser les erreurs carrées (c'est-à-dire l'exécution d'une régression OLS avec des variables de groupe factice). Le traiter de manière aléatoire signifie que nous supposons en outre que et utilisons le maximum de vraisemblance pour ajuster et au lieu d’ajuster chaque . Ceci conduit à l’effet de "pooling partiel", où les estimations sont réduites vers leur moyenne .puiu i u i ~ N ( u 0 , σ 2 u ) u 0 σ 2 u u i u i u 0β^u^iuiN(u0,σu2)u0σu2uiu^iu^0

    R formula when treating group as fixed:    y ~ x + group
    R formula when treating group as random:   y ~ x + (1|group)
    
  • En économétrie, nous pouvons traiter l'ensemble de ce modèle comme un modèle à effets fixes ou un modèle à effets aléatoires. La première option est équivalente à l’effet fixé ci-dessus (mais l’économétrie a sa propre méthode d’estimation de dans ce cas, appelée ). J'avais l'habitude de penser que la deuxième option est équivalente à l'effet aléatoire ci-dessus; Par exemple, @JiebiaoWang dans sa réponse très élue à Quelle est la différence entre les effets aléatoires, les effets fixes et le modèle marginal? dit ça β"within" estimator

    En économétrie, le modèle à effets aléatoires peut uniquement désigner un modèle à interception aléatoire, comme dans la biostatistique.

Okay - laissez-nous tester si cette compréhension est correcte. Voici quelques données aléatoires générées par @ChristophHanck dans sa réponse à Quelle est la différence entre les modèles à effets fixes, à effets aléatoires et à effets mixtes? (Je mets les données ici sur pastebin pour ceux qui n'utilisent pas R):

entrez la description de l'image ici

@Christoph fait deux crises en utilisant des approches économétriques:

fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

Le premier donne l'estimation du bêta égal à -1.0451, le second 0.77031(oui, positif!). J'ai essayé de le reproduire avec lmet lmer:

l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)

Le premier cède -1.045en parfait accord avec l’estimateur Within ci-dessus. Cool. Mais le second produit -1.026, qui se situe à des kilomètres de l’estimateur à effets aléatoires. Il h? Que se passe-t-il? En fait, ce qui est plmmême fait , lorsqu'il est appelé avec model = "random"?

Quoi qu'il en soit, peut-on le comprendre d'une manière ou d'une autre via la perspective de modèles mixtes?

Et quelle est l'intuition derrière tout ce qu'il fait? J'ai lu dans quelques endroits économétriques que l'estimateur à effets aléatoires est une moyenne pondérée entre l'estimateur à effets fixes et la "between" estimatorpente plus ou moins régressive si nous n'incluions pas du tout l'identité de groupe dans le modèle (cette estimation est fortement positive dans ce cas). cas, autour 4.) Par exemple, @Andy écrit ici :

L'estimateur à effets aléatoires utilise ensuite une moyenne pondérée par la matrice de la variation intra et inter de vos données. [...] Cela rend les effets aléatoires plus efficaces [.]

Pourquoi? Pourquoi voudrions-nous cette moyenne pondérée? Et en particulier, pourquoi le voudrions-nous au lieu d’utiliser un modèle mixte?


8
Wow, 20+ votes positifs et six réponses éclairantes en moins de 24 heures, mais toutes se concentrent sur le côté économétrique de think. Aucune réponse ne permet déjà d'établir un lien avec des modèles mixtes.
amibe dit de réintégrer Monica


Réponses:


16

Résumé: le "modèle à effets aléatoires" en économétrie et un "modèle mixte à interception aléatoire" sont bien les mêmes modèles, mais ils sont estimés de différentes manières. La méthode économétrique consiste à utiliser FGLS et la méthode à modèle mixte consiste à utiliser ML. Il existe différents algorithmes pour réaliser FGLS, et certains d'entre eux (sur cet ensemble de données) produisent des résultats très proches de ML.


1. Différences entre les méthodes d’estimation en plm

Je vais répondre avec mes tests sur plm(..., model = "random")et lmer()en utilisant les données générées par @ChristophHanck.

Selon le manuel du progiciel plm , il existe quatre options pour random.method: la méthode d’estimation des composantes de la variance dans le modèle à effets aléatoires. @ amoeba a utilisé celui par défaut swar(Swamy et Arora, 1972).

Pour les modèles à effets aléatoires, quatre estimateurs du paramètre de transformation sont disponibles en définissant random.ethhod sur l'une des méthodes suivantes: "swar" (Swamy et Arora (1972)) (par défaut), "amemiya" (Amemiya (1971)), "walhus" ( Wallace et Hussain (1969)), ou "nerlove" (Nerlove (1971)).

J'ai testé les quatre options en utilisant les mêmes données, en obtenant une erreuramemiya et trois estimations de coefficient totalement différentes pour la variable stackX. Ceux de using random.method='nerlove'et 'amemiya' sont presque équivalents à ceux de lmer()-1,029 et -1,025 vs -1,026. Ils ne sont pas non plus très différents de ceux obtenus dans le modèle "effets fixes", -1,045.

# "amemiya" only works using the most recent version:
# install.packages("plm", repos="http://R-Forge.R-project.org")

re0 <- plm(stackY~stackX, data = paneldata, model = "random") #random.method='swar'
re1 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='amemiya')
re2 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='walhus')
re3 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='nerlove')
l2  <- lmer(stackY~stackX+(1|as.factor(unit)), data = paneldata)

coef(re0)     #    (Intercept)   stackX    18.3458553   0.7703073 
coef(re1)     #    (Intercept)   stackX    30.217721   -1.025186 
coef(re2)     #    (Intercept)   stackX    -1.15584     3.71973 
coef(re3)     #    (Intercept)   stackX    30.243678   -1.029111 
fixef(l2)     #    (Intercept)   stackX    30.226295   -1.026482 

Malheureusement, je n'ai pas le temps, mais les lecteurs intéressés peuvent trouver les quatre références pour vérifier leurs procédures d'estimation. Il serait très utile de comprendre pourquoi ils font une telle différence. Je suppose que dans certains cas, la plmprocédure d’estimation utilisant les lm()données transformées on devrait être équivalente à la procédure de maximum de vraisemblance utilisée dans lmer().

2. Comparaison entre GLS et ML

Les auteurs du plmpackage ont comparé les deux de la section 7 de leur document: Yves Croissant et Giovanni Millo, 2008, Panel Data Econometrics dans R: The plm package .

L'économétrie porte principalement sur des données non expérimentales. L'accent est mis sur les procédures de spécification et les tests de spécification erronée. Les spécifications des modèles ont donc tendance à être très simples, alors que l’on accorde une grande attention aux problèmes d’endogénéité des régresseurs, de structures de dépendance aux erreurs et de robustesse des estimateurs par rapport aux écarts par rapport à la normalité. L'approche privilégiée est souvent semi-paramétrique ou non paramétrique, et les techniques compatibles avec l'hétéroscédasticité sont en train de devenir une pratique courante, tant pour l'estimation que pour le test.

Pour toutes ces raisons, l'estimation du modèle de panel en économétrie est principalement réalisée dans le cadre des moindres carrés généralisés basé sur le théorème d'Aitken [...]. Au contraire, les modèles de données longitudinales dans nlmeet lme4sont estimés par maximum de vraisemblance (restreint ou non restreint). [...]

L’approche économétrique GLS propose des solutions analytiques de type fermé calculables par algèbre linéaire standard et, bien que cette dernière puisse parfois peser lourdement sur la machine, les expressions des estimateurs sont généralement assez simples. L'estimation ML des modèles longitudinaux, au contraire, repose sur une optimisation numérique de fonctions non linéaires sans solutions de forme fermée et dépend donc d'approximations et de critères de convergence.


3. Mise à jour sur les modèles mixtes

J'apprécie que @ChristophHanck ait fourni une introduction détaillée sur les quatre méthodes random.methodutilisées plmet expliqué pourquoi leurs estimations sont si différentes. À la demande de @amoeba, je vais ajouter quelques réflexions sur les modèles mixtes (basés sur la vraisemblance) et leurs liens avec GLS.

La méthode basée sur la vraisemblance suppose généralement une distribution à la fois pour l'effet aléatoire et le terme d'erreur. Une hypothèse de distribution normale est couramment utilisée, mais certaines études supposent une distribution non normale. Je vais suivre les notations de @ ChristophHanck pour un modèle d'interception aléatoire et permettre des données non équilibrées, c'est-à-dire, laisser .T=ni

Le modèle est avec .

yit=xitβ+ηi+ϵiti=1,,m,t=1,,ni
ηiN(0,ση2),ϵitN(0,σϵ2)

Pour chaque , Donc, la fonction de log-vraisemblance esti

yiN(Xiβ,Σi),Σi=ση21ni1ni+σϵ2Ini.
const12ilog|Σi|12i(yiXiβ)Σi1(yiXiβ).

Lorsque tous les écarts sont connus, comme le montre Laird et Ware (1982), le MLE est ce qui est équivalent à GLS dérivé de @ChristophHanck. La principale différence réside donc dans l'estimation des variances. Étant donné qu’il n’existe pas de solution fermée, plusieurs approches sont possibles:

β^=(iXiΣi1Xi)1(iXiΣi1yi),
β^RE
  • maximisation directe de la fonction log-vraisemblance à l'aide d'algorithmes d'optimisation;
  • Algorithme d’expectation-maximisation (EM): il existe des solutions fermées, mais l’estimateur de implique des estimations bayésiennes empiriques de l’interception aléatoire;β
  • une combinaison des deux précédents, l'algorithme ECME (Espérance / Maximisation Conditionnelle) (Schafer, 1998; package R lmm). Avec un paramétrage différent, il existe des solutions fermées pour (comme ci-dessus) et . La solution pour peut être écrite ainsi: où est défini comme et peut être estimé dans un cadre EM.βσϵ2σϵ2
    σϵ2=1inii(yiXiβ^)(ξ^1ni1ni+Ini)1(yiXiβ^),
    ξση2/σϵ2

En résumé, MLE a des hypothèses de distribution et est estimé dans un algorithme itératif. La principale différence entre MLE et GLS réside dans l'estimation des variances.

Croissant et Millo (2008) ont souligné que

Bien que, dans les cas normaux, l'homoscédasticité et l'absence de corrélation en série des erreurs MLS constituent également l'estimateur du maximum de vraisemblance, il existe des différences importantes dans tous les autres cas.

À mon avis, pour l'hypothèse de distribution, tout comme la différence entre les approches paramétriques et non paramétriques, l'EML serait plus efficace lorsque l'hypothèse est vérifiée, tandis que GLS serait plus robuste.


Je soupçonne que le problème avec le message d'erreur est en quelque sorte lié au fait que je génère les variables en tant que vecteurs? Peut-être que plm préfère que les données soient stockées différemment?
Christoph Hanck

1
nerlovefonctionne bien ici, mais n’est pas implémenté pour les panneaux non équilibrés, comme je l’ai découvert en supprimant 1 observation du dernier panneau et en essayant d’exécuter toutes les méthodes.
amibe dit de réintégrer Monica

2
@ChristophHanck @amoeba L' plmerreur random.method="amemiya"me vient à l'esprit qu'ils devraient probablement utiliser X[, -1, drop=FALSE]plutôt que de X[, -1]conserver le format de matrice X[, -1]lorsqu'il n'y a qu'une seule covariable dans le modèle. Quoi qu'il en soit, j'ai essayé de surmonter ce problème en ajoutant une variable normale standard à la formule. amemiyareproduit le résultat avec une estimation de -1,02 et fonctionne également pour les données non équilibrées.
Randel

3
@ jiebiao-wang @ChristophHanck @amoeba la version de développement actuelle de plm fonctionne random.method="amemiya"correctement avec : var std.dev share idiosyncratic 0.6360 0.7975 0.002 indiv. 313.6510 17.7102 0.998 theta: 0.9841
Helix123

1
Bonjour @JiebiaoWang. J'ai pensé qu'après votre mise à jour, votre réponse répondrait à ma question de manière satisfaisante. J'ai pris la liberté de faire quelques modifications et d'insérer une mise à jour amemiyaet une citation sur le ML vs GLS. Je le marque comme accepté et je vais lui attribuer une prime. À votre santé.
Amibe dit de réintégrer Monica le

17

Cette réponse ne commente pas les modèles mixtes, mais je peux expliquer ce que fait l’estimateur à effets aléatoires et pourquoi il gache ce graphique.

Résumé: l’estimateur à effets aléatoires suppose que , ce qui n’est pas vrai dans cet exemple.E[uix]=0


Que fait l’estimateur d’effets aléatoires?

Supposons que nous avons le modèle:

yit=βxit+ui+ϵit

Nous avons deux dimensions de variation: les groupes et le temps . Pour estimer nous pourrions:itβ

  1. N'utilisez que les variations de séries temporelles au sein d' un groupe. C’est ce que fait l’estimateur à effets fixes (c’est pourquoi il est aussi souvent appelé l’estimateur interne).
  2. Si est aléatoire, nous ne pourrons utiliser que la variation transversale entre les moyennes chronologiques des groupes. Ceci est connu comme l' estimateur entre .ui

    Plus précisément, pour chaque groupe , prenez la moyenne dans le temps du modèle de données de panneau ci-dessus pour obtenir:i

    y¯i=βx¯i+vi where vi=ui+ϵ¯i

    Si nous effectuons cette régression, nous obtenons l’estimateur entre. Observez que c'est un estimateur cohérent si les effets sont un bruit blanc aléatoire, décorrélé de ! Si tel est le cas, lancer complètement la variation entre les groupes (comme nous le faisons avec l'estimateur à effets fixes) est inefficace.uix

L’estimateur à effets aléatoires de l’économétrie combine l’estimateur interne (1) (c’est-à-dire un estimateur à effets fixes) et (2) l’estimateur intermédiaire de manière à maximiser l’efficacité. C'est une application des moindres carrés généralisés et l'idée de base est la pondération inverse de la variance . Pour maximiser l'efficacité, l'estimateur à effets aléatoires calcule tant que moyenne pondérée de l'estimateur intra et de l'estimateur entre.β^

Que se passe-t-il dans ce graphique ...

En observant ce graphique, vous pouvez clairement voir ce qui se passe:

  • Dans chaque groupe (points de même couleur), un supérieur est associé à un inférieurixityit
  • Un groupe avec un supérieur a un supérieur .ix¯iui

L'hypothèse des effets aléatoires selon laquelle n'est clairement pas satisfaite. Les effets de groupe ne sont pas orthogonaux à (au sens statistique du terme), mais ont plutôt une relation positive avec .E[uix]=0uixx

L'estimateur entre suppose que . L'estimateur sur deux dit: "Bien sûr, je peux imposer en rendant positif!"E[uix]=0E[uix]=0β^

Ensuite, l'estimateur à effets aléatoires est désactivé car il s'agit d'une moyenne pondérée de l'estimateur interne et de l'estimateur entre.


+1, merci Matthew. Vous ne savez pas pourquoi quelqu'un a voté contre votre réponse. Je cherche une réponse établissant la connexion avec des modèles mixtes afin de ne pas accepter le vôtre, mais je le trouve quand même utile pour cette discussion. Si vous pouviez en dire un peu plus sur la façon dont la pondération GLS et la variance inverse sont appliquées et calculées ici, cela serait très utile.
Amibe dit de réintégrer Monica

16

Dans cette réponse, je voudrais développer un peu la réponse +1 de Matthew concernant la perspective GLS de ce que la littérature économétrique appelle l’estimateur à effets aléatoires.

Perspective GLS

Considérons le modèle linéaire Si elle considérait que nous pourrions simplement estimer le modèle par MLS groupée , ce qui revient à ignorer la structure de données du panneau et à regrouper simplement toutes les observations . .

yit=α+Xitβ+uiti=1,,m,t=1,,T
E(uit|Xit)=0n=mT

Nous modélisons le utilisant le modèle de composant d'erreuruit

uit=ηi+ϵit

En notation matricielle, le modèle peut être écrit sous la forme où et sont des vecteurs avec des valeurs typiques les éléments et , et est une matrice de variables muettes à (une colonne par unité). est tel que si une ligne correspond à une observation appartenant à l'unité , alors a un un dans la colonne et 0 sinon, .

y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,,m

Nous supposons en outre

E(ϵϵ)=σϵ2I

Les effets individuels spécifiques doivent être indépendants de . L’estimateur à effets aléatoires, contrairement à l’effet des effets fixes (encore une fois, la terminologie économétrique), requiert toutefois de plus l’hypothèse plus forte que Sous cette hypothèse, mise en pool Les MCO seraient non biaisés, mais nous pouvons en déduire un estimateur GLS. Supposons que les sont des IID avec un zéro moyen et une variance .ηϵit

E(ηi|X)=0
ηiση2

Cette hypothèse explique le terme effets aléatoires . En supposant en outre que les deux composants d’erreur soient indépendants, il est facile de voir que

Var(uit)=ση2+σϵ2Cov(uit,uis)=ση2Cov(uit,ujs)=0for all ij

On obtient alors les suivantes variance-covariance matrice : Ici, avec un vecteur de uns. Nous pouvons donc écrire pour l'estimateur GLS nous avons besoin de . À cette fin, passons ,n×nΩ

Ω=(ΣOOOΣOOOΣ)
Σ=ση2ιι+σϵ2IT
ιT
Ω=ση2(Imιι)+σϵ2(ImIT)
β^RE=(XΩ1X)1XΩ1y
Ω1JT=ιιJ¯T=JT/TET=ITJ¯T . Ensuite, écrivez ou en recueillant termes avec les mêmes matrices, Idempotence de et nous permet ensuite de montrer que où .
Ω=Tση2(ImJ¯T)+σϵ2(ImET)+σϵ2(ImJ¯T)
Ω=(Tση2+σϵ2)(ImJ¯T)+σϵ2(ImET)
P=ImJ¯TQ=ImET
Ω1=1σ12P+1σϵ2Q=ση2σ12σϵ2(Imιι)+1σϵ2(ImIT),
σ12=Tση2+σϵ2

La logique de Gauss-Markov explique ensuite pourquoi l’estimateur à effets aléatoires peut être utile, car c’est un estimateur plus efficace que les MCO groupés ou les effets fixes dans les hypothèses données (à condition que ce soit un très gros si dans de nombreuses applications de données de panel, le sont en effet décorrélés des régresseurs). En bref, GLS est plus efficace car la matrice de covariance d'erreur n'est pas homoscastastique dans ce modèle.ηi

On peut montrer que l’estimation GLS peut être obtenue en exécutant OLS sur les données partiellement dégradées: où . Pour on obtient l'estimateur à effet fixe ("dans"). Pour on obtient l'estimateur "entre". L'estimateur GLS est une moyenne pondérée entre les deux. (Pour on obtient l'estimateur MLS en pool.)

(yitθy¯i)=(XitθX¯i)β+(uitθui),
θ=1ση/σ1θ=1θθ=0

GLS réalisable

Pour rendre une approche FGLS pratique, nous avons besoin d'estimateurs de et . Baltagi, Analyse économétrique des données de panel, p. 16 (citant la 3ème édition), traite des options suivantes sur la façon de procéder.σ12σϵ2

Supposons d’abord que nous observions . Ensuite,uit

σ^12=T1mi=1mu¯i2
et seraient de bons estimateurs de leurs paramètres, avec la moyenne temporelle correspondant aux obseravations d'unité .
σ^ϵ2=1m(T1)i=1mt=1T(uit1mi=1mu¯i)2
u¯ii

L’ approche de Wallace et Hussein (1969) consiste à remplacer par les résidus d’une régression MLS groupée (qui, après tout, est toujours non biaisée et cohérente dans les hypothèses actuelles).u

L’ approche Amemiya (1971) suggère d’utiliser plutôt les résidus FE (ou LSDV). En termes de calcul, nous la restriction que pour contourner le piège de variable factice afin de pouvoir obtenir avec indiquant les moyennes moyennes sur et pour les résidus de LSDV .iηi=0α^=y¯X¯β^FEitu^=yα^Xβ^FE

L’ approche par défaut de Swamy et Arora (1972) estime que et Ici, .

σ^ϵ2=[yQ(IX(XQX)1XQ)y]/[m(T1)K]
σ^12=[yP(IZ(ZPX)1ZP)y]/[mK1]
Z=(ιmTX)

L’ approche de Nerlove (1971) estime partir de où le sont des issues d'une régression à effets fixes et est estimé à partir de la somme des carrés résiduels de cette régression, avec au dénominateur.ση2i=1m(η^iη^¯)2/(m1)η^iσ^ϵ2mT

Je suis également très surpris que cela fasse une telle différence, comme le montrent les calculs de Randel!

MODIFIER:

En ce qui concerne les différences, les estimations des composantes d'erreur peuvent être reprises dans le plmpaquet, et renvoient des résultats très différents, expliquant la différence entre les estimations ponctuelles pour (d'après la réponse de @ Randel, génère une erreur que je n'ai pas tenté de réparer):βamemiya

> ercomp(stackY~stackX, data = paneldata, method = "walhus")
                  var std.dev share
idiosyncratic 21.0726  4.5905 0.981
individual     0.4071  0.6380 0.019
theta:  0.06933  
> ercomp(stackY~stackX, data = paneldata, method = "swar")
                 var std.dev share
idiosyncratic 0.6437  0.8023 0.229
individual    2.1732  1.4742 0.771
theta:  0.811  
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
                   var  std.dev share
idiosyncratic   0.5565   0.7460 0.002
individual    342.2514  18.5000 0.998
theta:  0.9857  

Je soupçonne que les estimateurs des composantes d'erreur ne sont pas non plus cohérents dans mon exemple dans le fil conducteur où je cherche à démontrer les différences entre FE et RE en utilisant des données où les effets individuels et sont corrélés. (En fait, ils ne peuvent pas l'être, car ils éloignent finalement l'estimation RE de l'estimation FE par le fait que RE est une moyenne pondérée d'EF et entre des estimations avec des pondérations déterminées par les estimations de la composante d'erreur. Ainsi, si RE n'est pas cohérente, cela doit être finalement dû à ces estimations.)X

Si vous remplacez la fonction "fautive" de cet exemple,

alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))

simplement, par exemple,

alpha = runif(n)

Ainsi, pour les effets aléatoires non corrélés avec , vous obtenez des estimations ponctuelles RE pour très proches de la valeur réelle pour toutes les variantes d'estimation des composantes d'erreur.Xββ=1


Références

Amemiya, T., 1971, L'estimation des variances dans un modèle à composantes de variance , International Economic Review 12, 1–13.

Baltagi, BH, Analyse économétrique des données de panel, Wiley.

Nerlove, M., 1971a, Autres preuves de l'estimation des relations économiques dynamiques à partir d'une série chronologique de coupes transversales , Econometrica 39, 359–382.

Swamy, PAVB et SS Arora, 1972, Propriétés exactes de l'échantillon fini des estimateurs de coefficients dans les modèles de régression à composantes d'erreur , Econometrica 40, 261–275.

Wallace, TD et A. Hussain, 1969, Utilisation de modèles de composantes d'erreur en combinant des données en coupe transversale et chronologique , Econometrica 37, 55–72.


4
+1 Merci Christoph, cela est utile et je suis heureux de voir enfin quelques détails mathématiques dans ce fil. Il serait bon de voir comment fonctionnent les quatre méthodes implémentées plmet répertoriées par Randel et de mettre à jour votre réponse avec quelques commentaires à ce sujet. Si ce n'est pas les descriptions détaillées, alors au moins quelques notes brèves sur ce qui se passe. Pensez-vous que vous seriez capable de le rechercher? Je suis heureux d'offrir une prime pour cela :-) Mon approche naïve consisterait à estimer les deux sigmas à partir de la solution à effets fixes. Cela correspond-il à l'une des méthodes "nommées"?
amibe dit de réintégrer Monica

@ amoeba, j'ai inclus quelques commentaires sur la façon d'estimer les variances dans le modèle à composante d'erreur. Votre suggestion semble alors être étroitement liée à celle d'Amemiya.
Christoph Hanck

Très gentil merci. Nerlove n’utilise-t-il pas aussi la régression avec les nuls? En fait, je ne comprends pas très bien quelle est la différence entre Amemiya et Nerlove. Ma suggestion "naïve" consistait à ajuster la régression factice, à utiliser la variance résiduelle comme une estimation de et à utiliser la variance des coefficients factices à une estimation de . On dirait que c'est ce que fait Nerlove. Je ne suis pas sûr de comprendre ce que fait Amemiya et en quoi c'est différent. (Et je suis d'accord sur le fait qu'il reste une énorme question: pourquoi ces méthodes produisent-elles une telle différence dans ce cas?)σϵση
Amoeba dit Reinstate Monica

Oui, les deux utilisent la régression avec les nuls. Autant que je sache, une différence entre Amemiya et Nerlove est le dénominateur de la correction des degrés de liberté. Une autre est que je ne suis pas sûr que la variance des coefficients factices estimés soit la même que la variance des résidus. Une autre question cruciale est que Nerlove vise directement à estimer , alors que vous devez l'estimation via pour les trois autres et un inconvénient connu de ceux-ci est qu’il n’ya aucune garantie que ceux-ci soient non négatifs. ( σ 2 1 - σ 2 ε ) / Tση2(σ^12σ^ϵ2)/T
Christoph Hanck

1
Merci. J'ai fait une modification pour fournir une formule plus explicite pour , vous voudrez peut-être vérifier (mais je pense que c'est correct). J'ai commencé une prime que je vais attribuer à votre réponse. Cependant, je suis toujours à la recherche d’une réponse qui établisse un lien avec des modèles mixtes, contraste entre GLS et MLE, et explique pourquoi et quand on devrait préférer quelle approche (aucune des réponses actuelles ne le fait, il n’existe donc pas de réponse à ce sujet). cochez "accepté"). Il est intéressant de noter que MLE (tel que mis en œuvre par ) donne des estimations de variance très proches de celles de Nerlove. Ω1lmer
Amibe dit de réintégrer Monica

11

Je ne connais pas suffisamment R pour commenter votre code, mais le modèle mixte d'interception aléatoire simple doit être identique à l'estimateur RE MLE et très proche de l'estimateur RE GLS, sauf lorsque le total est petit et les données sont déséquilibrées. Espérons que cela sera utile pour diagnostiquer le problème. Bien entendu, tout cela en supposant que l'estimateur d'ER est approprié.N=iTi

Voici quelques Stata montrant l’équivalence (requis esttabet eststode CSS):

set more off
estimates clear
webuse nlswork, clear
eststo, title(mixed): mixed ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure || id: // Mixed estimator
eststo, title(MLE): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) mle // MLE RE estimator 
eststo, title(GLS): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) re // GLS RE estimato
esttab *, b(a5) se(a5) mtitle 

Voici le résultat de la dernière ligne:

. esttab *, b(a5) se(a5) mtitle 

------------------------------------------------------------
                      (1)             (2)             (3)   
                    mixed             MLE             GLS   
------------------------------------------------------------
main                                                        
grade            0.070790***     0.070790***     0.070760***
              (0.0017957)     (0.0017957)     (0.0018336)   

age              0.031844***     0.031844***     0.031906***
              (0.0027201)     (0.0027202)     (0.0027146)   

c.age#c.age   -0.00065130***  -0.00065130***  -0.00065295***
             (0.000044965)    (0.000044971)    (0.000044880)   

ttl_exp          0.035228***     0.035228***     0.035334***
              (0.0011382)     (0.0011392)     (0.0011446)   

tenure           0.037134***     0.037134***     0.037019***
              (0.0015715)     (0.0015723)     (0.0015681)   

c.tenure#c~e   -0.0018382***   -0.0018382***   -0.0018387***
             (0.00010128)    (0.00010128)    (0.00010108)   

_cons             0.14721***      0.14721***      0.14691** 
               (0.044725)      (0.044725)      (0.044928)   
------------------------------------------------------------
lns1_1_1                                                    
_cons            -1.31847***                                
               (0.013546)                                   
------------------------------------------------------------
lnsig_e                                                     
_cons            -1.23024***                                
              (0.0046256)                                   
------------------------------------------------------------
sigma_u                                                     
_cons                             0.26754***                
                              (0.0036240)                   
------------------------------------------------------------
sigma_e                                                     
_cons                             0.29222***                
                              (0.0013517)                   
------------------------------------------------------------
N                   28099           28099           28099   
------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Dans vos données, les hypothèses d'utilisation de l'estimateur RE ne sont pas satisfaites car l'effet de groupe est clairement corrélé à x, vous obtenez donc des estimations très différentes. L'estimateur GLS RE est en fait un estimateur à la méthode des moments généralisée (GMM) qui est une moyenne pondérée par la matrice des estimateurs entre et dans les estimateurs. L'estimateur intra va être OK ici, mais l'intervalle va être profondément foutu, montrant de grands effets positifs de X. GLS sera donc principalement l'estimateur entre les deux. Le MLE RE est un MLE qui maximise la probabilité du modèle à effets aléatoires. Ils ne sont plus censés produire la même réponse. Ici, l'estimateur mixte donne quelque chose de très proche de l'estimateur "au sein" de FE:

. esttab *, b(a5) se(a5) mtitle 

----------------------------------------------------------------------------
                      (1)             (2)             (3)             (4)   
                    mixed             GLS             MLE          Within   
----------------------------------------------------------------------------
main                                                                        
x                -1.02502***      0.77031**       3.37983***     -1.04507***
               (0.092425)       (0.26346)       (0.20635)      (0.093136)   

_cons             30.2166***      18.3459***      0.49507         30.3492***
                (5.12978)       (2.31566)             (.)       (0.62124)   
----------------------------------------------------------------------------
lns1_1_1                                                                    
_cons             2.87024***                                                
                (0.20498)                                                   
----------------------------------------------------------------------------
lnsig_e                                                                     
_cons            -0.22598**                                                 
               (0.077195)                                                   
----------------------------------------------------------------------------
sigma_u                                                                     
_cons                                             2.40363                   
                                                (1.28929)                   
----------------------------------------------------------------------------
sigma_e                                                                     
_cons                                             4.23472***                
                                                (0.37819)                   
----------------------------------------------------------------------------
N                      96              96              96              96   
----------------------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

Voici le code Stata pour le tableau ci-dessus:

clear
set more off
estimates clear

input int(obs id t) double(y x)
1      1           1  2.669271  0.5866982
2      1           2  1.475540  1.3500454
3      1           3  4.430008  0.6830919
4      1           4  2.162789  0.5845966
5      1           5  2.678108  1.0038879
6      1           6  3.456636  0.5863289
7      1           7  1.769204  2.3375403
8      1           8  3.413790  0.9640034
9      2           1  4.017493  1.5084121
10     2           2  4.218733  2.8982499
11     2           3  4.509530  3.2141335
12     2           4  6.106228  2.0317799
13     2           5  5.161379  2.1231733
14     2           6  2.724643  4.3369017
15     2           7  4.500306  1.9141065
16     2           8  4.119322  2.8667938
17     3           1  9.987779  2.3961969
18     3           2  7.768579  3.5509275
19     3           3  9.379788  3.3284869
20     3           4 10.035937  2.2997389
21     3           5 11.752360  2.8143474
22     3           6  9.500264  2.1825704
23     3           7  8.921687  5.0126462
24     3           8  8.269932  3.4046339
25     4           1 12.101253  3.2928033
26     4           2 11.482337  3.1645218
27     4           3 10.648010  4.8073987
28     4           4  9.687320  5.3394193
29     4           5 12.796925  3.1197431
30     4           6  9.971434  4.6512983
31     4           7 10.239717  4.7709378
32     4           8 12.245207  2.7952426
33     5           1 18.473320  5.8421967
34     5           2 19.097212  4.9425391
35     5           3 19.460495  4.9166172
36     5           4 18.642305  4.9856035
37     5           5 17.723912  5.0594425
38     5           6 16.783248  4.8615618
39     5           7 16.100984  6.2069167
40     5           8 18.851351  3.8856152
41     6           1 19.683171  7.5568816
42     6           2 21.104231  6.7441900
43     6           3 22.115529  6.4486514
44     6           4 22.061362  5.3727434
45     6           5 22.457905  5.8665798
46     6           6 21.424413  6.0578997
47     6           7 23.475946  4.4024323
48     6           8 24.884950  4.1596914
49     7           1 25.809011  7.6756255
50     7           2 25.432828  7.7910756
51     7           3 26.790387  7.3858301
52     7           4 24.640850  8.2090606
53     7           5 26.050086  7.3779219
54     7           6 25.297148  6.8098617
55     7           7 26.551229  7.6694272
56     7           8 26.669760  6.4425772
57     8           1 26.409669  8.3040894
58     8           2 26.570003  8.4686087
59     8           3 29.018818  7.2476785
60     8           4 30.342613  4.5207729
61     8           5 26.819959  8.7935557
62     8           6 27.147711  8.3141224
63     8           7 26.168568  9.0148308
64     8           8 27.653552  8.2081808
65     9           1 34.120485  7.8415520
66     9           2 31.286463  9.7234259
67     9           3 35.763403  6.9202442
68     9           4 31.974599  9.0078286
69     9           5 32.273719  9.4954288
70     9           6 29.666208 10.2525763
71     9           7 30.949857  9.4751679
72     9           8 33.485967  8.1824810
73    10           1 36.183128 10.7891587
74    10           2 37.706116  9.7119548
75    10           3 38.582725  8.6388290
76    10           4 35.876781 10.8259279
77    10           5 37.111179  9.9805046
78    10           6 40.313149  7.7487456
79    10           7 38.606329 10.2891107
80    10           8 37.041938 10.3568765
81    11           1 42.617586 12.1619185
82    11           2 41.787495 11.1420338
83    11           3 43.944968 11.1898730
84    11           4 43.446467 10.8099599
85    11           5 43.420819 11.2696770
86    11           6 42.367318 11.6183869
87    11           7 43.543785 11.1336555
88    11           8 43.750271 12.0311065
89    12           1 46.122429 12.3528733
90    12           2 47.604306 11.4522787
91    12           3 45.568748 13.6906476
92    12           4 48.331177 12.3561907
93    12           5 47.143246 11.7339915
94    12           6 44.461190 13.3898768
95    12           7 46.879044 11.4054972
96    12           8 46.314055 12.3143487
end

eststo, title(mixed): mixed y x || id:, mle // Mixed estimator
eststo, title(GLS): xtreg y x, i(id) re     // GLS RE estimato
eststo, title(MLE): xtreg y x, i(id) mle    // MLE RE estimator 
eststo, title(Within): xtreg y x, i(id) fe  // FE Within estimator 
eststo, title(Between): xtreg y x, i(id) be // Between estimator 

esttab *, b(a5) se(a5) mtitle 

+1 Merci Dimitriy, il est certainement utile de voir la sortie de Stata sur le même jeu de données de jouets. J'ai une question à propos de l'estimateur MLE. Je pensais que l'approche de modèle mixte ( mixeddans Stata et lmerdans R) est aussi un maximum de vraisemblance ou parfois un "maximum de vraisemblance restreint" (je peux utiliser les deux dans mon lmerappel en définissant REML=Tou REML=Fet ils donnent des résultats presque identiques). Cependant, l'approche de modèle mixte donne un résultat très raisonnable et correct, alors que ce que Stat appelle "MLE" donne un résultat insensé dans ce cas. Quelle est la différence? À quoi se réfère exactement le "MLE" de Stat?
Amibe dit de réintégrer Monica

2
@amoeba deux mixed, mleet xtreg, mlesont des estimateurs MLE, mais les fonctions de vraisemblance sont quelque peu différentes. Voir ici pour le premier, et ici pour le dernier. Je ne comprends pas très bien pourquoi le mixedmodèle est si robuste.
Dimitriy V. Masterov

xtmixed est ce que mix a été appelé dans les anciennes versions de Stata. Pour vos données, cette équivalence ne tient manifestement pas, alors qu'elle vaut pour mes données, comme le suggère le manuel.
Dimitriy V. Masterov

ssc install estoutBien que je me souvienne, il avait des fonctionnalités différentes selon les versions et n’était pas compatible avec les versions antérieures.
StasK

1
@StasK m'a mis en contact avec le support technique de Stata et ilsxtreg, mle m'ont dit que c'était probablement un bug . "En général, le résultat devrait être le même [...]. Ce type de différences se produit normalement lorsqu'il existe des problèmes d'identification lors de l'estimation des paramètres du modèle. [...] J'ai effectivement vérifié le numéro de condition de la variance. La matrice de co-variance résultant des deux calculs et de ce nombre est fondamentalement infinie pour -xtreg, mle- et plus de 4000 pour -mixée, mle-. [...] les développeurs vont évaluer le problème afin de déterminer si un code fixe est nécessaire. "
amibe dit de réintégrer Monica

9

Laissez-moi confondre encore plus les choses:

ÉCONOMÉTRIE - APPROCHE À EFFETS FIXES
L’approche à "effets fixes" en économétrie pour les données de panel est un moyen d’estimer les coefficients de pente (les bêtas), en "contournant" l’existence de la variable à effets individuels , et donc en ne faire une hypothèse quant à savoir si elle est "fixe" ou "aléatoire". C’est ce que font l’estimateur "Première différence" (en utilisant les premières différences de données) et l’estimateur "Dans" (en utilisant les écarts par rapport aux moyennes temporelles): ils parviennent à estimer uniquement les bêta.αi

Pour une approche plus traditionnelle qui traite explicitement les effets individuels (les "intercepts") comme des constantes, nous utilisons l’estimateur de la variable muette des moindres carrés (LSDV), qui fournit également des estimations pour la 's Note: dans le modèle linéaire, Trois estimateurs coïncident algébriquement en ce qui concerne les estimations produites pour les bêta - mais uniquement dans le modèle linéaire.αi

Discussion (en partie extraite des notes de cours)

"Le principal avantage de l'approche à effets fixes est qu'il n'est pas nécessaire de faire d'hypothèses sur la nature des effets individuels. Nous devrions l'appliquer chaque fois que nous soupçonnons que ces derniers sont corrélés à un ou plusieurs des facteurs de régression car dans ce cas, Ignorer la présence d'une telle corrélation et appliquer naïvement les MCO sur le modèle groupé produit des estimateurs incohérents.En dépit de son attrait en raison des hypothèses minimales que nous devons formuler concernant les effets individuels, l'approche des effets fixes présente certaines limites. les régresseurs invariants ne peuvent pas être estimés car ces variables sont différenciées avec les effets individuels non observables.les effets individuels (dans le cas où nous utilisons l'estimateur LSDV) ne peuvent pas être estimés de manière cohérente (sauf si nous laissons la dimension temporelle aller à l'infini). "

ÉCONOMÉTRIE - APPROCHE
À EFFETS ALÉATOIRES Dans l'approche à effets aléatoires économétriques "classique", nous supposons que les "interceptions" individuelles sont des "composants aléatoires permanents", tandis que les termes d'erreur "habituels" sont des composants d'erreur "transitoires".αi

Dans une extension intéressante, le caractère aléatoire supplémentaire découle de l’existence d’un effet temporel aléatoire , commun à toutes les sections efficaces mais variant dans le temps , ainsi qu’un effet individuel fixe (constant) et le terme d’erreur. Cet "effet de temps", par exemple, peut représenter un choc global au niveau de l’ensemble de l’économie qui affecte également tous les ménages. De telles perturbations globales sont effectivement observées et il semble donc que ce soit un choix de modélisation réaliste.

Ici, l’estimateur "à effets aléatoires" est un estimateur par les moindres carrés généralisés (GLS), pour une efficacité accrue.

À présent, un autre estimateur conçu, l’estimateur «entre», exécute la méthode MCO sur les observations moyennées dans le temps. En ce qui concerne l'algèbre, il a été montré que l'estimateur GLS peut être obtenu sous forme de moyenne pondérée des estimateurs Within et Between, où les poids ne sont pas arbitraires mais se rapportent aux matrices de VCV des deux.

... et il existe également les variantes des modèles "Effets aléatoires non corrélés" et "Effets aléatoires corrélés".

J'espère que ce qui précède aide à faire le contraste avec les modèles à "effets mixtes".


+1, merci Alecos. C'est utile, mais la relation entre tout cela et l'approche des modèles mixtes reste floue pour moi. Je commence à soupçonner qu'il n'y a peut-être aucune relation. Les estimateurs entre et dans les estimateurs (et que les estimateurs dans sont équivalents aux variables nominales de la classe) sont clairs au passage; Ma confusion ne concerne que l'approche des effets aléatoires.
Amibe dit de réintégrer Monica
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.