Confusion avec le test Dickey Fuller augmenté


16

Je travaille sur l'ensemble des données electricitydisponibles dans le package R TSA. Mon objectif est de savoir si un arimamodèle sera approprié pour ces données et éventuellement de l'adapter. J'ai donc procédé comme suit:

1er: Tracer la série chronologique qui a résulté si le graphique suivant: ts plot1

2e: Je voulais prendre un journal de electricitypour stabiliser la variance et ensuite différencié la série comme il convient, mais juste avant de le faire, j'ai testé la stationnarité sur le ensemble de données d'origine à l'aide du adftest (Augmented Dickey Fuller) et, de façon surprenante, il a donné les résultats suivants:

Code et résultats:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Eh bien, selon la notion de série temporelle de mon débutant, je suppose que cela signifie que les données sont stationnaires (petite valeur de p, rejetons l'hypothèse nulle de non-stationnarité). Mais en regardant l'intrigue ts, je ne trouve aucun moyen que cela puisse être stationnaire. Quelqu'un a-t-il une explication valable à cela?


5
ADF ne teste que la racine unitaire stationnaire, cela pourrait être stationnaire. Vous devez donc utiliser le test KPSS, voir stats.stackexchange.com/questions/30569/… En général, il existe une différence entre les modèles DS (différence stationnaire) et TS (tendance stationnaire). KPSS est le meilleur test pour faire la distinction entre ces modèles, voir le lien pour plus de détails.
Stat Tistician

3
On dirait que la série a des saisons et une tendance. Intégrez au test ADF une tendance déterministe + des variables indicatrices saisonnières et lancez le test. Vérifiez également les résidus autocorrélés.
Pantera

Réponses:


12

adf.testxtxt1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

2

En supposant que "adf.test" provient vraiment du package "tseries" (directement ou indirectement), la raison en serait qu'il inclut automatiquement une tendance temporelle linéaire. Extrait du doc ​​tseries (version 0.10-35): "L'équation de régression générale qui incorpore une constante et une tendance linéaire est utilisée [...]" Le résultat du test indique donc bien la stationnarité de la tendance (qui malgré le nom n'est pas stationnaire).

Je conviens également avec Pantera que les effets saisonniers pourraient fausser le résultat. La série pourrait en réalité être une tendance temporelle + saisonnières déterministes + processus de racine unitaire stochastique, mais le test ADF pourrait mal interpréter les fluctuations saisonnières comme des inversions stochastiques de la tendance déterministe, ce qui impliquerait des racines plus petites que l'unité. (D'un autre côté, étant donné que vous avez inclus suffisamment de décalages, cela devrait plutôt apparaître comme des racines unitaires (parasites) aux fréquences saisonnières, et non pas la fréquence zéro / à long terme que le test ADF examine. Dans tous les cas, étant donné la modèle saisonnier, il est préférable d'inclure les saisonniers.)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.