La non-stationnarité dans logit / probit est-elle importante?


8

Je voudrais demander - j'utilise logit pour rechercher si certaines variables améliorent le risque de crise monétaire. J'ai des données annuelles de 1980 pour de nombreux pays (panel déséquilibré), la variable muette est 1 si les crises monétaires ont commencé (selon ma définition), 0 sinon. Les variables explicatives sont selon certaines théories, comme le compte courant / PIB, les avoirs extérieurs nets / PIB, les prêts / PIB et ainsi de suite ... Tous sont décalés (-1). J'utilise des erreurs standard robustes, qui devraient être cohérentes avec l'hétéroskédasticité. Cependant, par exemple, les prêts au PIB ou NFA / PIB ne sont pas stationnaires (test de panel). Est-ce important? Je n'ai vu aucun test papier pour la stationnarité effectuer logit / probit. Pour moi, il est également intuitif que cela n'a pas d'importance. Si je teste si une variable augmente le risque de crise, cela ne devrait pas poser de problème, que cette variable augmente en permanence. Au contraire - une variable croissante augmente en permanence le risque de crise et lorsqu'elle atteint un niveau insoutenable, la crise se produit. Pourriez-vous me donner une réponse, si j'ai raison?


2
Y a-t-il une raison pour laquelle vous ne pouvez pas utiliser des effets fixes dans le temps? Cela permet souvent de contrôler les changements de niveau des variables non stationnaires. Le logit utilise le maximum de vraisemblance qui suppose des erreurs latentes iid. Si les erreurs sont corrélées dans le temps, cela pourrait entraîner un ajustement biaisé quelle que soit la façon dont les erreurs standard sont calculées. Encore une fois, l'utilisation d'effets fixes dans le temps devrait expliquer la majeure partie de cela.
Zachary Blumenfeld

2
Ils n'autorisent pas d'effet fixe dans le logit car ils essaient d'éviter le biais de paramètre accidentel qui, à la réflexion, est logique. Une chose que vous pourriez faire est d'exécuter un modèle de probabilité linéaire, avec et sans effets temporels aléatoires / fixes. Vous pouvez effectuer des diagnostics résiduels pour ces modèles et voir si vos marges d'intérêt changent. Si vos résidus au sein du groupe ne sont pas corrélés et que les contrôles de temps ne modifient pas les marges de manière significative, vous pouvez être d'accord avec le logit (les marges moyennes devraient être similaires pour le logit au modèle linéaire)
Zachary Blumenfeld

2
Il y a aussi des choses intéressantes que vous pouvez faire avec le rééchantillonnage pour réduire le biais accidentel dans les modèles de panel non linéaires qui, je pense, s'appliquent bien à votre problème. <a href=" onlinelibrary.wiley.com/doi/10.1111/j.1468-0262.2004.00533.x/…> est un document de Hahn et Newey qui le fait avec un jacknife. Je ne saurais pas comment mettre en œuvre quelque chose comme ceci dans Eveiws ou STATA (Désolé), mais je suis sûr que c'est
Zachary Blumenfeld

1
Je ne suis pas sûr à 100%. L'idée avec le modèle linéaire est que vous pouvez facilement effectuer des diagnostics résiduels pour la non-stationnarité (ou l'auto-corrélation) dans les résidus. Les effets marginaux moyens pour le logit devraient être extrêmement proches des marges du modèle linéaire. En utilisant ce fait, si vous savez que le modèle linéaire est sans biais (en vérifiant les résidus), vous pouvez dire que le logit estime également les effets marginaux moyens sans biais (étant donné que vous observez que les marges moyennes sont à peu près les mêmes pour les deux modèles). Ainsi, il semblerait raisonnable de croire que le logit est non biaisé.
Zachary Blumenfeld

1
Quand il s'agit de la première différenciation, c'est un peu comme "dé-signifier" les variables de série chronologique qui est très similaire à l'idée d'ajouter des effets fixes ... en contrôlant les changements de niveau pour chaque période de temps individuelle. Cependant, le traitement formel de ce genre peut être calme complexe et il y a encore une chance pour autocorrelation dans les résidus <a href=" people.stern.nyu.edu/jsimonof/classes/2301/pdf/...> a quelques suggestions sensibles à l' aide pearson résidus pour vérifier les auto - corrélation.
Zachary Blumenfeld

Réponses:


5

Quel que soit le modèle que vous utilisez, les principes fondamentaux de la théorie économétrique doivent être vérifiés et respectés. Les chercheurs se pavanent sur leur utilisation de modèles très sophistiqués, mais souvent - plus ou moins volontairement - ils oublient les fondamentaux de l'économétrie; ils deviennent donc assez ridicoles. L'économétrie n'est rien d'autre qu'une estimation de la moyenne et de la variance de vos paramètres, mais si la moyenne, la variance et la covariance de vos variables changent au fil du temps, des dispositifs et une analyse appropriés doivent être effectués. À mon avis, les modèles probit / logit avec des données non stationnaires n'ont aucun sens parce que vous voulez ajuster le côté droit de votre équation (qui est non stationnaire) dans le côté gauche qui est une variable binaire. La structure de la dynamique temporelle de vos variables indépendantes doit être cohérente avec celles dépendantes. Si certains de vos régresseurs ne sont pas stationnaires, vous spécifiez mal votre relation; en effet il faut que la combinaison de vos régresseurs soit immobile. Je pense donc que vous devrez probablement effectuer une régression en deux étapes. Dans la première, vous trouvez une relation stationnaire de vos variables, puis vous mettez cette relation dans votre modèle probit / logit et estimez un seul paramètre.

Évidemment, dans la première étape, vous devez avoir à la liste deux variables intégrées (dans le cas de la cointégration) ou au moins deux variables avec le même type de tendance. Si ce n'est pas le cas, vous avez un problème de variables omises.

L'alternative à tout cela est que vous changez la portée de votre analyse et transformez tous vos régresseurs en régresseurs stationnaires.


3

Je suggère de regarder les résultats dans Chang Jiang Park (2006) et Park, Phillips (2000) . * Selon le premier article, les estimateurs logit sont cohérents même dans le cas de séries intégrées (théorème 2 à la page 6-7) et habituelles Les statistiques t peuvent être utilisées pour les paramètres d'intérêt dans votre cas (les coefficients sur les régresseurs). D'autres articles des mêmes auteurs développent une théorie économétrique pour d'autres cas de processus non stationnaires dans des modèles non linéaires.

* Ces articles ne traitent que de la théorie, je ne suis malheureusement pas en mesure de trouver un exemple d'un article empirique mentionnant réellement la question de la non-stationnarité dans ce contexte.


1

Je sais que ce post est ancien mais les gens font des recherches et utilisent souvent ce truc comme référence.

Restons simples. Ayons un modèle de probabilité individuelle de défaut de paiement sur une hypothèque comme notre Y. Permet maintenant d'exécuter le PIB de niveau sur elle. Disons que vos données sont de 2002 à 2017, trimestrielles. Vous avez des millions d'observations qui au temps T partagent toutes les mêmes variables économiques. Je choisis cette période pour une bonne raison.

Qu'obtiendrez-vous en tant que relation? Oh mec, vous constaterez que shazaam, un PIB plus faible est corrélé à des valeurs par défaut plus élevées. Ça a l'air bien non?

Mais permet maintenant de prévoir cela, disons 50 ans (pour le plaisir). Prenez le PIB attendu au taux de croissance historique, disons 2%, et extrapolez le PIB. Exécutez maintenant la prévision. Que trouvez-vous? Shazaam, comme par magie, la probabilité de défaut tendra vers 0%.

Vous obtiendriez le contraire si vous choisissez le nombre total de chômeurs (pas le taux). Vous trouverez ce shazaam, le prévoir à l'avenir et la probabilité de tendances par défaut à 100%.

Les deux sont ridicules. Et voici le kicker. Si vous avez fait un test stationnaire sur certains de ces délais, vous constaterez qu'ils sont stationnaires. La raison en est que vous pouvez découper une série non stationnaire en parties stationnaires. En particulier parce que le PIB réel a augmenté, diminué et augmenté au cours de la période.

Oui, votre ajustement d'échantillon aura fière allure. Mais vos prévisions n'auront aucun sens.

Je le constate fréquemment dans la modélisation des métriques de risque.


-1

Vous êtes clairement bien d'un point de vue théorique. C'est une compréhension erronée des séries non stationnaires qu'elles ont des moyens changeants. Ils n'ont aucun moyen. La moyenne de l'échantillon est un nombre aléatoire car elle ne converge en aucun point et semble donc changer. Ce n'est pas non plus un problème pour logit ou probit.

Les modèles statistiques sont des mappages et il n'y a aucune raison pour laquelle on ne peut pas encapsuler une série non liée dans une série bornée. Par exemple, la vraie ligne numérique est normalement considérée comme n'ayant aucune longueur, mais l'enroule autour d'un cercle avec le pôle sud étant 0 et le pôle nord étant et pour un cercle unitaire, la ligne numérique entière a maintenant une longueur . π

En mappant une série non stationnaire à un ensemble bien délimité, vous avez créé un problème bien délimité car la solution ultime doit correspondre à l'intervalle [0,1].

Tous les ratios comptables doivent être dépourvus d'écart et tous les rendements financiers doivent être dépourvus d'écart. Voir l'article à https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2828744

Vous n'avez pas à vous soucier intrinsèquement des erreurs robustes. C'est un malentendu des séries non stationnaires qu'elles sont hétéroskédastiques. Ils ne sont pas; ils sont demandés parce qu'ils n'ont aucun moyen de former une variance à propos en premier lieu, c'est donc encore une fois un nombre aléatoire. La structure des termes d'erreur a plus à voir avec le modèle qui mappe que le manque de stationnarité.

Là où vous pourriez faire face à un problème, c'est avec le concept de covariance. La distribution des rendements des actions provient d'une distribution qui n'a pas de matrice de covariance. Ce n'est pas que les stocks ne peuvent pas venir, mais ils ne peuvent pas convoiter. La même chose est vraie pour les économies. C'est un concept plus complexe que la covariance qui est une relation simple. Vous voudrez lire le document ci-dessus et réfléchir attentivement à vos relations de modèle.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.