Quelles sont les exigences de stationnarité de l'utilisation de la régression avec des erreurs ARIMA (régression dynamique) pour l'inférence?
Plus précisément, j'ai une variable de résultat continue non stationnaire , une variable prédictive continue non stationnaire et une série de traitement de variable fictive . Je voudrais savoir si le traitement était corrélé à un changement dans la variable de résultat qui est à plus de deux erreurs standard loin du changement nul.
Je ne sais pas si je dois différencier ces séries avant d'effectuer la régression avec la modélisation des erreurs ARIMA. Dans une réponse à une autre question, IrishStat déclare que while the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.
puis il continue à ajouter que unwarranted usage [of differencing] can create statistical/econometric nonsense
.
Le Guide de l'utilisateur SAS suggère qu'il est correct d'adapter des modèles de régression avec des erreurs ARIMA à des séries non stationnaires sans différenciation tant que les résidus ne sont pas stationnaires:
Notez que l'exigence de stationnarité s'applique à la série de bruit. S'il n'y a pas de variables d'entrée, la série de réponses (après différenciation et moins le terme moyen) et la série de bruit sont les mêmes. Cependant, s'il y a des entrées, la série de bruit est le résiduel après suppression de l'effet des entrées.
Il n'est pas nécessaire que la série d'entrée soit stationnaire. Si les entrées ne sont pas stationnaires, la série de réponses sera non stationnaire, même si le processus de bruit peut être stationnaire.
Lorsque des séries d'entrées non stationnaires sont utilisées, vous pouvez d'abord ajuster les variables d'entrée sans modèle ARMA pour les erreurs, puis prendre en compte la stationnarité des résidus avant d'identifier un modèle ARMA pour la partie bruit.
En revanche, Rob Hyndman & George Athanasopoulos affirment :
Une considération importante dans l'estimation d'une régression avec des erreurs ARMA est que toutes les variables du modèle doivent d'abord être stationnaires. Nous devons donc d'abord vérifier que yt et tous les prédicteurs semblent être stationnaires. Si nous estimons le modèle alors que l'un d'entre eux n'est pas stationnaire, les coefficients estimés peuvent être incorrects.
Une exception à cela est le cas où les variables non stationnaires sont co-intégrées. S'il existe une combinaison linéaire entre le non stationnaire et les prédicteurs stationnaires, alors les coefficients estimés sont corrects.
Ces conseils sont-ils mutuellement exclusifs? Comment l'analyste appliqué doit-il procéder?