La procédure à effets fixes de Mundlak est-elle applicable pour la régression logistique avec des variables muettes?


12

J'ai un ensemble de données avec 8000 grappes et 4 millions d'observations. Malheureusement, mon logiciel statistique, Stata, fonctionne assez lentement lorsque j'utilise sa fonction de données de panel pour la régression logistique: xtlogitmême avec un sous-échantillon de 10%.

Cependant, lorsque vous utilisez la logitfonction non- panneau , les résultats apparaissent beaucoup plus tôt. Par conséquent, je pourrai peut-être bénéficier de l'utilisation logitde données modifiées qui tiennent compte des effets fixes.

Je crois que cette procédure est inventée la "procédure à effets fixes de Mundlak" (Mundlak, Y. 1978. Regroupement de séries chronologiques et de données transversales. Econometrica, 46 (1), 69-85.)

J'ai trouvé une explication intuitive de cette procédure dans un article d' Antonakis, J., Bendahan, S., Jacquart, P., et Lalive, R. (2010). Sur les allégations causales: un examen et des recommandations. The Leadership Quarterly, 21 (6). 1086-1120. Je cite:

Une façon de contourner le problème des effets fixes omis et d'inclure toujours les variables de niveau 2 consiste à inclure les moyennes de cluster de toutes les covariables de niveau 1 dans le modèle estimé (Mundlak, 1978). Les moyennes des grappes peuvent être incluses sous forme de régresseurs ou soustraites (c.-à-d. Centrage moyen des grappes) de la covariable de niveau 1. Les moyennes des grappes sont invariantes au sein des grappes (et varient selon les grappes) et permettent une estimation cohérente des paramètres de niveau 1 comme si des effets fixes avaient été inclus (voir Rabe-Hesketh et Skrondal, 2008).

Par conséquent, le centrage par grappes semble idéal et pratique pour résoudre mon problème de calcul. Cependant, ces articles semblent être orientés vers la régression linéaire (OLS).

Cette méthode de centrage en grappes est-elle également applicable pour la "réplication" de régression logistique binaire à effets fixes?

Une question plus technique qui devrait aboutir à la même réponse serait: le xtlogit depvar indepvars, fejeu de données A est-il égal au logit depvar indepvarsjeu de données B lorsque le jeu de données B est la version centrée sur la moyenne des clusters du jeu de données A?

Une difficulté supplémentaire que j'ai trouvée dans ce centrage en grappes est de savoir comment faire face aux mannequins. Parce que les variables muettes sont soit 0 soit 1, sont-elles identiques dans la régression à effets fixes et aléatoires? Ne devraient-ils pas être «centrés»?

Réponses:


9

La première différenciation ou au sein de transformations telles que la dégradation n'est pas disponible dans les modèles comme logit car dans le cas des modèles non linéaires, ces astuces ne suppriment pas les effets fixes non observés. Même si vous disposiez d'un ensemble de données plus petit dans lequel il était possible d'inclure N-1 variables muettes pour estimer directement les effets fixes, cela conduirait à des estimations biaisées à moins que la dimension temporelle de vos données ne soit grande. L'élimination des effets fixes dans panel logit ne suit donc ni différenciation ni dégradation et n'est possible qu'en raison de la forme fonctionnelle logit. Si vous êtes intéressé par les détails, vous pouvez consulter ces notes de Söderbom sur le PDF page 30 (explication des raisons pour lesquelles la dégradation / la première différence dans logit / probit n'aide pas) et page 42 (introduction de l'estimateur de panel logit).

Un autre problème est que xtlogitles modèles logit de panel en général n’estiment pas directement les effets fixes qui sont nécessaires pour calculer les effets marginaux. Sans ceux-ci, il sera très difficile d'interpréter vos coefficients qui pourraient être décevants après avoir exécuté le modèle pendant des heures et des heures.

Avec un si grand ensemble de données et les difficultés de conception mentionnées précédemment du logit de panel FE, je m'en tiendrai au modèle de probabilité linéaire. J'espère que cette réponse ne vous déçoit pas, mais il y a de nombreuses bonnes raisons pour donner de tels conseils: le LPM est beaucoup plus rapide, les coefficients peuvent être interprétés tout de suite (cela vaut en particulier si vous avez des effets d'interaction dans votre modèle parce que l'interprétation de leur dans les modèles non linéaires change!), les effets fixes sont facilement contrôlés et vous pouvez ajuster les erreurs standard pour l'autocorrélation et les grappes sans que les temps d'estimation n'augmentent au-delà de la raison. J'espère que ça aide.


1
Ce n'est pas une solution mais c'est une réponse. Merci :)
Tom

1
Petit point: la p20 de ces diapositives fait votre cas, mais un modèle de correction Mundlak aka `` effets aléatoires corrélés '' est décrit à la p47 et ne semble pas comporter de telles mises en garde.
conjugateprior

1

Je crois que le logit conditionnel ("clogit" sur Stata), c'est un estimateur de panel logit à effet fixe alternatif.

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf


5
Bienvenue sur le site! Je pense que ce n'est pas une réponse acceptable, car la question est en fait: comment éviter la régression logistique conditionnelle (à effets fixes) par une régression logistique transversale modifiée, dans le but d'accélérer l'estimation. Comme votre référence l'indique (en haut de la page 3), "nous pouvons utiliser Statala clogitcommande de ou la xtlogit, fecommande pour effectuer une analyse logit à effets fixes. Les deux donnent les mêmes résultats. (En fait, je crois en xtlogit, fefait appelle clogit.)" OP savait déjà xtlogit, fesur la base de l'avant-dernier paragraphe.
Randel

0

Allison a discuté de ce problème dans Allison, (2009), «Modèles de régression à effets fixes», p.32f.

Allison fait valoir qu'il n'est pas possible d'estimer un modèle inconditionnel avec un maximum de vraisemblance. C'est le cas parce que les modèles deviennent biaisés en raison du "problème des paramètres accessoires". Il recommande plutôt d'utiliser un modèle logit conditionnel (Chamberlain, 1980). Ceci est accompli en conditionnant la fonction de vraisemblance sur le nombre d'événements observés pour chaque individu.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.