Je vais essayer de répondre à la douce pression de whuber de simplement «répondre à la question» et de rester sur le sujet. On nous donne 144 lectures mensuelles d'une série appelée «The Airline Series». Box et Jenkins ont été largement critiqués pour avoir fourni une prévision qui était extrêmement élevée en raison de la «nature explosive» d'une transformation inversée.
Visuellement on a l'impression que la variance de la série originale augmente avec le niveau de la série suggérant un besoin de transformation. Cependant, nous savons que l'une des exigences d'un modèle utile est que la variance des «erreurs de modèle» doit être homogène. Aucune hypothèse n'est nécessaire sur la variance de la série d'origine. Ils sont identiques si le modèle est simplement une constante c'est-à-dire y (t) = u. Comme /stats//users/2392/probabilityislogic l'a dit si clairement dans sa réponse aux conseils sur l'explication de l'hétérogénéité / hétéroscédastictie "une chose que je trouve toujours amusante est cette" non-normalité des données "qui inquiète les gens à propos. Les données n'ont pas besoin d'être distribuées normalement, mais le terme d'erreur le fait »
Les premiers travaux dans les séries chronologiques ont souvent tiré à tort des conclusions sur les transformations injustifiées. Nous découvrirons ici que la transformation corrective de ces données consiste simplement à ajouter trois séries factices indicatrices au modèle ARIMA reflétant un ajustement pour trois points de données inhabituels. Voici le tracé de la fonction d'autocorrélation suggérant une forte autocorrélation au décalage 12 (0,76) et au décalage 1 (0,948). Les autocorrélations sont simplement des coefficients de régression dans un modèle où y est la variable dépendante prédite par un décalage de y.
!
L'analyse ci-dessus suggère que l'on modélise les premières différences de la série et étudie cette «série résiduelle» qui est identique aux premières différences d'abord pour ses propriétés.
Cette analyse reconfirme l'idée qu'il existe un fort modèle saisonnier dans les données qui pourrait être corrigé ou modélisé par un modèle qui contenait deux opérateurs de différenciation.
Cette double différenciation simple produit un ensemble de résidus, c'est-à-dire une série ajustée ou, en gros, une série transformée qui met en évidence une variance non constante, mais la raison de la variance non constante est la moyenne non constante des résidus. séries doublement différenciées, suggérant trois anomalies à la fin de la série. L'autocorrélation de cette série indique à tort que «tout va bien» et qu'il pourrait être nécessaire de procéder à tout ajustement Ma (1). Des précautions doivent être prises car il y a une suggestion d'anomalies dans les données donc l'acf est biaisé vers le bas. C'est ce que l'on appelle «l'effet Alice au pays des merveilles», c'est-à-dire l'acceptation de l'hypothèse nulle de l'absence de structure évidente lorsque cette structure est masquée par une violation de l'une des hypothèses.
Nous détectons visuellement trois points inhabituels (117,135,136)
Cette étape de détection des valeurs aberrantes est appelée détection d'intervention et peut être facilement, ou pas si facilement, programmée en suivant le travail de Tsay.
Si nous ajoutons trois indicateurs au modèle, nous obtenons
On peut alors estimer
Et recevez un tracé des résidus et de l'acf
Cet acf suggère que nous ajoutons potentiellement deux coefficients de moyenne mobile au modèle. Ainsi, le prochain modèle estimé pourrait être.
Céder
On pourrait alors supprimer la constante non significative et obtenir un modèle affiné:
On note qu'aucune transformation de puissance n'a été nécessaire pour obtenir un ensemble de résidus à variance constante. Notez que les prévisions ne sont pas explosives.
En termes de somme pondérée simple, nous avons: 13 poids; 3 non nul et égal à (1.0.1,0., - 1,0)
Ce matériel a été présenté d'une manière qui n'était pas automatique et nécessitait par conséquent une interaction de l'utilisateur en termes de prise de décisions de modélisation.