Pourquoi les modèles à effets aléatoires exigent-ils que les effets ne soient pas corrélés avec les variables d'entrée, alors que les modèles à effets fixes permettent une corrélation?

11

Il existe deux hypothèses communes concernant l'effet spécifique individuel, l'hypothèse d'effets aléatoires et l'hypothèse d'effets fixes. L'hypothèse des effets aléatoires (faite dans un modèle à effets aléatoires) est que les effets spécifiques individuels ne sont pas corrélés avec les variables indépendantes. L'hypothèse de l'effet fixe est que l'effet spécifique individuel est corrélé avec les variables indépendantes. Si l'hypothèse des effets aléatoires est vérifiée, le modèle à effets aléatoires est plus efficace que le modèle à effets fixes. Cependant, si cette hypothèse n'est pas vérifiée (c.-à-d. Si le test de Durbin-Watson échoue), le modèle à effets aléatoires n'est pas cohérent.

Je me demandais pourquoi les modèles à effets aléatoires nécessitent que les effets aléatoires ne soient pas corrélés avec les variables d'entrée, alors que les modèles à effets fixes permettent de corréler les effets avec la variable d'entrée?

Merci!

random-effects-model fixed-effects-model

— Tim
source

18

Lorsque vous incluez une variable dans une régression, son coefficient est estimé en maintenant toutes les autres variables du modèle fixes. Si la variable est corrélée avec une autre variable qui n'est pas incluse dans votre modèle, son coefficient ne peut pas être estimé en maintenant cette variable omise constante. Cela conduit à un biais de variables omis.

L'approche à effets fixes ajoute des variables au modèle représentant les individus ou les groupes d'intérêt. Par conséquent, les autres coefficients du modèle peuvent être calculés en maintenant l'individu ou le groupe fixe. Il s'agit de l'estimateur intra (individuel ou de groupe).

L'approche à effets aléatoires n'ajoute pas de variables au modèle représentant les individus ou les groupes. Au lieu de cela, il modélise la structure des corrélations des termes d'erreur. Essentiellement, l'effet aléatoire est considéré comme un décalage parallèle non estimé dans la droite de régression et ce même décalage s'applique à toutes les observations pour un individu ou un groupe particulier. Cela conduit à corréler tous ces éléments dans les observations individuelles ou de groupe. Les effets aléatoires modélisent cette corrélation.

Le modèle à effet aléatoire omet essentiellement l'effet fixe et surmonte l'omission en modélisant la structure d'erreur. C'est très bien tant que l'effet fixe omis n'est corrélé avec aucune variable incluse. Comme indiqué ci-dessus, ces variables omises conduisent à des estimations de coefficient biaisées.

L'avantage d'exclure les effets fixes, comme le fait la procédure des effets aléatoires, est que les variables qui ne varient pas dans les observations d'un individu ou d'un groupe ne peuvent pas être incluses avec les effets fixes en raison de la multicolinéarité; les effets aléatoires sont le seul moyen d'estimer les coefficients de ces variables.

— Charlie
source

Que pensez-vous de la modélisation de l'effet fixe estimé en fonction des variables invariantes dans le temps?

— Dimitriy V. Masterov

@Tim Pourriez-vous envisager d'accepter cette réponse et de marquer ce fil comme répondu?

— Charlotte R

Non, les modèles à effets aléatoires incluent définitivement des variables représentant les individus ou les groupes. Ils sont juste sujets au retrait. Voir par exemple cette réponse: stats.stackexchange.com/a/111896/11646

— Paul

4

D'après ce que je sais, les effets aléatoires sont une sorte d'extension d'un modèle OLS, dans lequel la constante est incluse dans le vecteur des régresseurs, et l'erreur est composée à la fois d'un effet non observé (invariant dans le temps) et d'une erreur observée ( variante temporelle).

Je ne sais pas très bien comment répondre à votre question, mais je dirais simplement que les modèles RE nécessitent que l'erreur ne soit pas corrélée avec les variables indépendantes car, si elles sont corrélées, cela signifie que vous êtes dans le cas où les estimations FE sont plus approprié. Vous pouvez tester lequel d'entre eux interprète mieux votre jeu de données en effectuant un test de Hausman une fois que vous avez exécuté la régression avec les deux spécifications.

Ceci est tiré de l'analyse économétrique des données de coupe transversale et de panel, par Wooldridge:

entrez la description de l'image ici

(...)

entrez la description de l'image ici

— Herman Haugland
source