Quelle est exactement la méthode Box-Jenkins pour les processus ARIMA?

10

La page Wikipedia indique que Box-Jenkins est une méthode d'ajustement d'un modèle ARIMA à une série chronologique. Maintenant, si je veux adapter un modèle ARIMA à une série chronologique, je vais ouvrir SAS, appeler proc ARIMA, fournir les paramètres et SAS me donnera les coefficients AR et MA. Maintenant, je peux essayer différentes combinaisons de et SAS me donnera un ensemble de coefficients dans chaque cas. Je sélectionne l'ensemble avec le critère d'information Akaike le plus bas. $p,d,q$ $p,d,q$

Ma question est: où dans la procédure ci-dessus ai-je utilisé Box-Jenkins? Suis-je censé utiliser Box-Jenkins pour arriver à des estimations initiales de ? Ou SAS l'a-t-il utilisé en interne d'une manière ou d'une autre? $p,d,q$

— Victor
source

10

Box et Jenkins eux-mêmes n'ont pas utilisé AIC. Leur livre est sorti en 1970 sur la base d'une méthodologie développée précédemment, tandis que les articles d'Akaike sur l'AIC sont arrivés (peu de temps) après la publication du livre.

Leur méthodologie est décrite dans leur livre [1], mais ce qui est aujourd'hui inclus sous le manteau de "Box-Jenkins" est un peu plus large et varie d'une personne à l'autre.

Box et Jenkins donnent eux-mêmes un organigramme simple sur l'identification des modèles qui pourrait être considéré comme un résumé utile du processus qu'ils ont utilisé pour identifier les modèles. (Je suggère de consulter le livre si vous le pouvez - la plupart des bibliothèques universitaires décentes devraient en avoir un exemplaire.)

Ils ont incorporé des étapes d'identification, d'estimation et de vérification / validation diagnostique du modèle (y compris un retour à la première étape si le modèle est inadéquat), puis une fois qu'un modèle adéquat est identifié, le modèle peut être prévu.

La page wikipedia ici donne un aperçu du genre de chose qui est impliquée, mais elle contient un certain nombre de choses qui ont été ajoutées à ce que les gens ont tendance à faire depuis la sortie du livre. En effet, de nombreux documents qui décrivent la méthodologie de Box-Jenkins de nos jours incluraient l'utilisation d'AIC ou de quantités similaires.

Voir également la discussion ici .

Des livres plus récents (voir par exemple la page wikipedia ci-dessus) donnent une version plus «moderne» de l'approche générale.

En fin de compte, si vous voulez savoir ce qu'est vraiment la méthodologie de Box-Jenkins, je dirais «commencez avec leur livre». À défaut, un certain nombre de traitements plus récents des modèles ARIMA couvrent une méthodologie largement similaire - essayez un certain nombre de livres de séries chronologiques raisonnablement décents qui couvrent les modèles ARIMA.

[1]: Box, George; Jenkins, Gwilym (1970),
Analyse des séries chronologiques: Prévision et contrôle
San Francisco: Holden-Day

— Glen_b -Reinstate Monica
source

10

La méthodologie Box-Jenkins est une stratégie ou une procédure qui peut être utilisée pour construire un modèle ARIMA. La méthodologie est décrite dans le livre Time Series Analysis: Forecasting and Control de George EP Box et Gwilym M. Jenkins, publié à l'origine en 1970 - des éditions plus récentes existent.

En ouvrant SAS, en appelant proc ARIMA et en fournissant des numéros pour p, d et q, vous avez simplement estimé un modèle ARIMA. Faire cela aveuglément, c'est-à-dire en n'utilisant aucune méthodologie particulière reconnue pour identifier le modèle ARIMA lui-même, c'est un peu comme jouer avec des allumettes - les dangers du logiciel!

Si vous continuez à répéter ce processus - en estimant beaucoup et beaucoup de modèles ARIMA - vous pourrez éventuellement sélectionner un modèle avec le critère d'information Akaike le plus bas (parmi l'ensemble de modèles que vous avez estimé). Dans ce contexte, une approche plus systématique serait d'utiliser un algorithme basé sur la comparaison des valeurs AIC pour une variété de modèles différents pour sélectionner automatiquement un modèle ARIMA pour vous, tel que celui fourni par le package de prévision dans R - le nom de la fonction pertinente est auto.arima().

Quoi qu'il en soit, la procédure que vous avez décrite impliquait de sélectionner un modèle ARIMA basé sur la minimisation de certains critères d'information (dans ce cas, l'AIC, mais il existe d'autres mesures). C'est une méthodologie particulière, mais ce n'est pas la méthodologie de Box-Jenkins; une alternative.

La méthodologie Box-Jenkins comprend cinq étapes (bien que l'on dit parfois qu'elle ne comporte que trois étapes):

Vérifier la stationnarité ou la non-stationnarité et transformer les données, si nécessaire;
Identification d'un modèle ARMA approprié;
Estimation des paramètres du modèle choisi;
Vérification diagnostique de l'adéquation du modèle; et
Prévision ou répétition des étapes deux à cinq.

Il s'agit notamment d'un processus itératif qui implique que le constructeur de modèles exerce un certain jugement - et c'est un aspect de la méthodologie qui a été considéré comme une lacune. La partie de jugement entre en jeu notamment lors de l'interprétation de deux outils; à savoir, la fonction d'autocorrélation (estimée) (ACF) et la fonction d'autocorrélation partielle (PACF).

Si vous souhaitez devenir un praticien de la méthodologie Box-Jenkins, je vous recommande de consulter le texte original (vous seriez surpris de ce que les manuels modernes omettent!) À côté des variations modernes que vous pouvez trouver. Alan Pankratz a quelques excellents manuels, que je recommanderais également fortement; par exemple, Prévision avec des modèles Box-Jenkins univariés: concepts et cas .

L'expérience me suggère que le terme "méthodologie de Box-Jenkins" est utilisé de manière lâche parce que j'ai entendu certaines personnes l'utiliser pour se référer simplement à la construction de modèles ARIMA en général - et non au processus réel impliqué dans la construction d'un modèle ARIMA - tandis que d'autres l'utilisent pour se référer à une version modifiée de ce qui a été publié en 1970. Comme l'a souligné @Glen_b, "il existe de nombreux documents qui décrivent la méthodologie de Box-Jenkins de nos jours qui incluraient l'utilisation d'AIC ou de quantités similaires" .

Q: Êtes-vous censé utiliser la méthodologie de Box-Jenkins pour arriver à des estimations initiales de p, d, q?

Comme déjà mentionné, il existe différentes stratégies de sélection de modèles, la réponse est non, ce n'est pas nécessairement le cas si vous devez utiliser la méthodologie Box-Jenkins, mais vous le pourriez si vous le vouliez.

Q: SAS l'a-t-il utilisé en interne d'une manière ou d'une autre?

Très peu probable à moins que ce logiciel n'offre une fonction assez sophistiquée! Consultez la documentation officielle de SAS pour plus de détails sur ce que le logiciel fait ou est capable de faire. Si c'était R, vous pourriez regarder le code source, mais je doute que ce soit une option avec SAS.

— Graeme Walsh
source