Interprétation du modèle ARIMA

J'ai une question sur les modèles ARIMA. Disons que j'ai une série temporelle que je voudrais prévoir et qu'un semble être un bon moyen de mener l'exercice de prévision. $Y_t$ $\text{ARIMA}(2,2)$

Δ Y_{t} = α_{1} Δ Y_{t - 1} + α_{2} Δ Y_{t - 2} + ν_{t} + θ_{1} ν_{t - 1} + θ_{2} ν_{t - 2}

$\Delta Y_t = \alpha_1 \Delta Y_{t-1} + \alpha_2 \Delta Y_{t-2} + \nu_{t} + \theta_1 \nu_{t-1} + \theta_2 \nu_{t-2}$ Maintenant, les

décalés impliquent que ma série d'aujourd'hui est influencée par des événements antérieurs. C'est logique. Mais quelle est l'interprétation des erreurs? Mon résidu antérieur (à quel point j'étais dans mon calcul) influence la valeur de ma série aujourd'hui? Comment les résidus décalés sont-ils calculés dans cette régression, car il s'agit du produit / reste de la régression?

Y

$Y$

regression time-series interpretation

— Gabriel
source

Je pense que vous devez vous rappeler que les modèles ARIMA sont des modèles athéoriques , donc les règles habituelles d'interprétation des coefficients de régression estimés ne s'appliquent pas strictement de la même manière. Les modèles ARIMA ont certaines fonctionnalités à connaître. Par exemple, plus les valeurs de

faibles dans un AR (1), plus le taux de convergence est rapide. Mais, prenons par exemple un modèle AR (2). Tous les modèles AR (2) ne sont pas identiques! Par exemple, si la condition

α_{1}

$\alpha_{1}$

est satisfaite, l'AR (2) afficheun comportement pseudo-périodiqueet, par conséquent, ses prévisions sont des cycles stochastiques.

(α_{1}^{2} + 4 α_{2} < 0)

$(\alpha_{1}^{2}+4\alpha_{2}<0)$

— Graeme Walsh

(suite ...) D'une manière quelque peu similaire, lorsqu'il s'agit d'autorégressions vectorielles, on a tendance à interpréter les fonctions de réponse impulsionnelle (IRF) plutôt que les coefficients estimés; les coefficients sont souvent trop difficiles à interpréter, mais on peut généralement comprendre les IRF. Par curiosité, avez-vous trouvé de nombreux articles dans lesquels le ou les auteurs ont consacré beaucoup d'attention à l'interprétation des coefficients dans un modèle ARIMA?

— Graeme Walsh

Il semble y avoir un problème de notation. "

" ne peut pas être exact, car les modèles ARIMA ont trois termes

pour chacun des composants AR / I / MA respectivement, tandis que les modèles ARMA en ont deux (par exemple

) - mais vous semblez avoir une première différenciation, ce qui suggère que vous voulez dire

. Veuillez modifier pour refléter votre intention.

ARIMA (2, 2)

$\text{ARIMA}(2,2)$

(p, d, q)

$(p,d,q)$

ARMA (2, 2)

$\text{ARMA}(2,2)$

ARIMA (2, 1, 2)

$\text{ARIMA}(2,1,2)$

— Glen_b -Reinstate Monica

@Glen_b Je me souviens avoir posé la même chose sur une autre question . Il s'avère que nous avons une sorte de duplication. La question actuelle et celle qui y est liée sont très similaires.

— Graeme Walsh

Je pense que vous devez vous rappeler que les modèles ARIMA sont des modèles athéoriques , donc l'approche habituelle pour interpréter les coefficients de régression estimés ne s'applique pas vraiment à la modélisation ARIMA.

Afin d'interpréter (ou de comprendre) les modèles ARIMA estimés, il serait bon de connaître les différentes caractéristiques affichées par un certain nombre de modèles ARIMA courants.

Nous pouvons explorer certaines de ces caractéristiques en étudiant les types de prévisions produites par différents modèles ARIMA. C'est l'approche principale que j'ai adoptée ci-dessous, mais une bonne alternative serait d'examiner les fonctions de réponse impulsionnelle ou les chemins temporels dynamiques associés à différents modèles ARIMA (ou équations aux différences stochastiques). J'en parlerai à la fin.

Modèles AR (1)

Considérons un modèle AR (1) pendant un moment. Dans ce modèle, nous pouvons dire que plus la valeur de est faible, plus le taux de convergence (vers la moyenne) est rapide. Nous pouvons essayer de comprendre cet aspect des modèles AR (1) en étudiant la nature des prévisions pour un petit ensemble de modèles AR (1) simulés avec des valeurs différentes pour $\alpha_{1}$ $\alpha_{1}$

L'ensemble des quatre modèles AR (1) dont nous discuterons peut être écrit en notation algébrique comme:

{Oui}_{t} = C + 0,95 {Oui}_{t - 1} + ν_{t} (1) {Oui}_{t} = C + 0,8 {Oui}_{t - 1} + ν_{t} (2) {Oui}_{t} = C + 0,5 {Oui}_{t - 1} + ν_{t} (3) {Oui}_{t} = C + 0,4 {Oui}_{t - 1} + ν_{t} (4)

$\begin{equation} Y_{t} = C + 0.95 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (1)\\ Y_{t} = C + 0.8 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (2)\\ Y_{t} = C + 0.5 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (3)\\ Y_{t} = C + 0.4 Y_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (4) \end{equation}$

C

$C$

α_{1}

$\alpha_{1}$

$\alpha_{1} = 0.95$ $\alpha_{1} = 0.4$

entrez la description de l'image ici

Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.

Modèles MA (1)

$\theta_{1}$

{Oui}_{t} = C + 0,95 ν_{t - 1} + ν_{t} (5) {Oui}_{t} = C + 0,8 ν_{t - 1} + ν_{t} (6) {Oui}_{t} = C + 0,5 ν_{t - 1} + ν_{t} (sept) {Oui}_{t} = C + 0,4 ν_{t - 1} + ν_{t} (8)

$\begin{equation} Y_{t} = C + 0.95 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (5)\\ Y_{t} = C + 0.8 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (6)\\ Y_{t} = C + 0.5 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (7)\\ Y_{t} = C + 0.4 \nu_{t-1} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (8) \end{equation}$

Dans le graphique ci-dessous, j'ai tracé des prévisions hors échantillon pour ces quatre modèles MA (1) différents. Comme le montre le graphique, le comportement des prévisions dans les quatre cas est sensiblement similaire; convergence rapide (linéaire) vers la moyenne. Notez qu'il y a moins de variété dans la dynamique de ces prévisions par rapport à celles des modèles AR (1).

entrez la description de l'image ici

Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.

Modèles AR (2)

Les choses deviennent beaucoup plus intéressantes lorsque nous commençons à envisager des modèles ARIMA plus complexes. Prenons par exemple les modèles AR (2). Ce ne sont qu'un petit pas en avant par rapport au modèle AR (1), non? Eh bien, on pourrait penser cela, mais la dynamique des modèles AR (2) est assez riche en variété comme nous le verrons dans un instant.

Explorons quatre modèles AR (2) différents:

{Oui}_{t} = C + 1,7 {Oui}_{t - 1} - 0,8 {Oui}_{t - 2} + ν_{t} (9) {Oui}_{t} = C + 0,9 {Oui}_{t - 1} - 0,2 {Oui}_{t - 2} + ν_{t} (dix) {Oui}_{t} = C + 0,5 {Oui}_{t - 1} - 0,2 {Oui}_{t - 2} + ν_{t} (11) {Oui}_{t} = C + 0,1 {Oui}_{t - 1} - 0,7 {Oui}_{t - 2} + ν_{t} (12)

$\begin{equation} Y_{t} = C + 1.7 Y_{t-1} -0.8 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (9)\\ Y_{t} = C + 0.9 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (10)\\ Y_{t} = C + 0.5 Y_{t-1} -0.2 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (11)\\ Y_{t} = C + 0.1 Y_{t-1} -0.7 Y_{t-2} + \nu_{t} ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (12) \end{equation}$

Les prévisions hors échantillon associées à chacun de ces modèles sont présentées dans le graphique ci-dessous. Il est assez clair qu'ils diffèrent chacun de manière significative et ils sont également assez variés par rapport aux prévisions que nous avons vues ci-dessus - à l'exception des prévisions du modèle 2 (graphique en haut à droite) qui se comportent de manière similaire à celles d'un AR (1) modèle.

entrez la description de l'image ici

Remarque: lorsque la ligne rouge est horizontale, elle a atteint la moyenne de la série simulée.

α_{1}^{2} + 4 α_{2} < 0,

$\begin{equation} \alpha_{1}^{2}+4\alpha_{2} < 0, \end{equation}$

Il convient de noter que la condition ci-dessus provient de la solution générale à la forme homogène de l'équation de différence linéaire, autonome et de second ordre (avec des racines complexes). Si cela vous est étranger, je recommande à la fois le chapitre 1 de Hamilton (1994) et le chapitre 20 de Hoy et al. (2001).

(1,7)^{2} + 4 (- 0,8) = - 0,31 < 0 (13) (0,9)^{2} + 4 (- 0,2) = 0,01 > 0 (14) (0,5)^{2} + 4 (- 0,2) = - 0,55 < 0 (15) (0,1)^{2} + 4 (- 0,7) = - 2,54 < 0 (16)

$\begin{equation} (1.7)^{2} + 4 (-0.8) = -0.31 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (13)\\ (0.9)^{2} + 4 (-0.2) = 0.01 > 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (14)\\ (0.5)^{2} + 4 (-0.2) = -0.55 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (15)\\ (0.1)^{2} + 4 (-0.7) = -2.54 < 0 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (16) \end{equation}$

Comme prévu par l'apparition des prévisions tracées, la condition est remplie pour chacun des quatre modèles, sauf pour le modèle 2. Rappelons sur le graphique que les prévisions du modèle 2 se comportent ("normalement") de manière similaire aux prévisions d'un modèle AR (1). Les prévisions associées aux autres modèles contiennent des cycles.

Application - Modélisation de l'inflation

$\pi_{t}$

π_{t} = C + α_{1} π_{t - 1} + α_{2} π_{t - 2} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{2} \pi_{t-2} + \nu_{t}. \end{equation}$ . Maintenant, je ne m'opposerais pas à une telle interprétation, mais je suggère de faire preuve de prudence et de creuser un peu plus pour trouver une interprétation correcte. Dans ce cas, nous pourrions demander, de quelle manière l'inflation est-elle liée aux niveaux d'inflation précédents? Y a-t-il des cycles? Si oui, combien de cycles y a-t-il? Peut-on dire quelque chose sur le pic et le creux? À quelle vitesse les prévisions convergent-elles vers la moyenne? Etc.

Ce sont les types de questions que nous pouvons poser en essayant d'interpréter un modèle AR (2) et comme vous pouvez le voir, ce n'est pas aussi simple que de prendre un coefficient estimé et de dire "une augmentation de 1 unité de cette variable est associée à un si- de nombreuses unités augmentent dans la variable dépendante " - en veillant bien sûr à associer la condition ceteris paribus à cette déclaration.

Gardez à l'esprit que dans notre discussion jusqu'à présent, nous n'avons exploré qu'une sélection de modèles AR (1), MA (1) et AR (2). Nous n'avons même pas examiné la dynamique des modèles ARMA mixtes et des modèles ARIMA impliquant des retards plus élevés.

$\alpha_{2}$

π_{t} = C + α_{1} π_{t - 1} + α_{3} π_{t - 3} + θ_{1} ν_{t - 1} + ν_{t} .

$\begin{equation} \pi_{t} = C + \alpha_{1} \pi_{t-1} + \alpha_{3} \pi_{t-3} + \theta_{1}\nu_{t-1} + \nu_{t}. \end{equation}$

Dites ce que vous voulez, mais ici, il vaut mieux essayer de comprendre la dynamique du système lui-même. Comme précédemment, nous pouvons regarder et voir quel type de prévisions produit le modèle, mais l'approche alternative que j'ai mentionnée au début de cette réponse était d'examiner la fonction de réponse impulsionnelle ou le trajet temporel associé au système.

Cela m'amène à la partie suivante de ma réponse où nous discuterons des fonctions de réponse impulsionnelle.

Fonctions de réponse impulsionnelle

Ceux qui sont familiers avec les autorégressions vectorielles (VAR) seront conscients que l'on essaie généralement de comprendre le modèle VAR estimé en interprétant les fonctions de réponse impulsionnelle; plutôt que d'essayer d'interpréter les coefficients estimés qui sont souvent trop difficiles à interpréter de toute façon.

La même approche peut être adoptée en essayant de comprendre les modèles ARIMA. Autrement dit, plutôt que d'essayer de donner un sens à des déclarations (compliquées) comme "l'inflation d'aujourd'hui dépend de l'inflation d'hier et de l'inflation d'il y a deux mois, mais pas de l'inflation de la semaine dernière!" , nous traçons plutôt la fonction de réponse impulsionnelle et essayons de donner un sens à cela.

Application - Quatre variables macro

\begin{array}{rcl} {Oui}_{t} & = & 3,20 + 0,22 {Oui}_{t - 1} + 0,15 {Oui}_{t - 2} + ν_{t} \\ π_{t} & = & 4.10 + 0,46 π_{t - 1} + 0,31 π_{t - 2} + 0,16 π_{t - 3} + 0,01 π_{t - 4} + ν_{t} \\ u_{t} & = & 6.2 + 1,58 u_{t - 1} - 0,64 u_{t - 2} + ν_{t} \\ r_{t} & = & 6.0 + 1,18 r_{t - 1} - 0,23 r_{t - 2} + ν_{t} \end{array}

$\begin{eqnarray} Y_{t} &=& 3.20 + 0.22 Y_{t-1} + 0.15 Y_{t-2} + \nu_{t}\\ \pi_{t} &=& 4.10 + 0.46 \pi_{t-1} + 0.31\pi_{t-2} + 0.16\pi_{t-3} + 0.01\pi_{t-4} + \nu_{t}\\ u_{t} &=& 6.2+ 1.58 u_{t-1} - 0.64 u_{t-2} + \nu_{t}\\ r_{t} &=& 6.0 + 1.18 r_{t-1} - 0.23 r_{t-2} + \nu_{t} \end{eqnarray}$

Y_{t}

$Y_{t}$

t

$t$

π

$\pi$

u

$u$

r

$r$

Les équations montrent que la croissance du PIB, le taux de chômage et le taux d'intérêt à court terme sont modélisés comme des processus AR (2) tandis que l'inflation est modélisée comme un processus AR (4).

Plutôt que d'essayer d'interpréter les coefficients dans chaque équation, traçons les fonctions de réponse impulsionnelle (IRF) et interprétons-les à la place. Le graphique ci-dessous montre les fonctions de réponse impulsionnelle associées à chacun de ces modèles.

entrez la description de l'image ici

Ne prenez pas cela comme une masterclass dans l'interprétation des IRF - pensez plutôt à une introduction de base - mais de toute façon, pour nous aider à interpréter les IRF, nous devrons nous habituer à deux concepts; élan et persévérance .

Ces deux concepts sont définis dans Leamer (2010) comme suit:

Momentum : Momentum est la tendance à continuer de se déplacer dans la même direction. L'effet de quantité de mouvement peut compenser la force de régression (convergence) vers la moyenne et peut permettre à une variable de s'éloigner de sa moyenne historique, pendant un certain temps, mais pas indéfiniment.

Persistance : une variable de persistance restera là où elle se trouve et ne convergera lentement que vers la moyenne historique.

Munis de ces connaissances, nous posons maintenant la question: supposons qu'une variable soit à sa moyenne historique et qu'elle subisse un choc temporaire d'une unité sur une seule période, comment la variable va-t-elle réagir dans les périodes futures? Cela revient à poser les questions que nous avons posées auparavant, par exemple: les prévisions contiennent-elles des cycles? , à quelle vitesse les prévisions convergent-elles vers la moyenne? , etc.

Nous pouvons enfin tenter d'interpréter les IRF.

Après un choc d'une unité, le taux de chômage et le taux d'intérêt à court terme (trésorerie à 3 mois) sont éloignés de leur moyenne historique. C'est l'effet de l'élan. Les FRI montrent également que le taux de chômage dépasse largement le taux d'intérêt à court terme.

Nous constatons également que toutes les variables reviennent à leurs moyennes historiques (aucune ne «saute»), bien qu'elles le fassent chacune à des rythmes différents. Par exemple, la croissance du PIB revient à sa moyenne historique après environ 6 périodes après un choc, le taux de chômage revient à sa moyenne historique après environ 18 périodes, mais l'inflation et les intérêts à court terme mettent plus de 20 périodes pour revenir à leurs moyennes historiques. En ce sens, la croissance du PIB est la moins persistante des quatre variables tandis que l'inflation peut être considérée comme très persistante.

Je pense que c'est une conclusion juste de dire que nous avons réussi (au moins partiellement) à donner un sens à ce que les quatre modèles ARIMA nous disent à propos de chacune des quatre macro-variables.

Conclusion

Plutôt que d'essayer d'interpréter les coefficients estimés dans les modèles ARIMA (difficile pour de nombreux modèles), essayez plutôt de comprendre la dynamique du système. Nous pouvons tenter cela en explorant les prévisions produites par notre modèle et en traçant la fonction de réponse impulsionnelle.

[Je suis assez heureux de partager mon code R si quelqu'un le veut.]

Les références

Hamilton, JD (1994). Analyse des séries chronologiques (Vol.2). Princeton: Presse universitaire de Princeton.
Leamer, E. (2010). Modèles macroéconomiques et histoires - Un guide pour les MBA, Springer.
Stengos, T., M. Hoy, J. Livernois, C. McKenna et R. Rees (2001). Mathematics for Economics, 2e édition, MIT Press: Cambridge, MA.

— Graeme Walsh
source

J'adore l'application de l'IRF aux non-VAR. Ils semblent toujours être associés et je n'avais jamais pensé à utiliser des IRF sur de simples ARIMA. (Ce plus, qui peut vraiment comprendre ce que font les termes MA?)

— Wayne

Quelle bonne réponse!

— Richard Hardy

$MA(\infty)$

Δ {Oui}_{t} = \sum_{j = 0}^{\infty} ψ_{j} ν_{t - j}

$\Delta Y_t=\sum_{j=0}^{\infty} \psi_j\nu_{t-j}$

$MA(1)$ $AR(1)$

{Oui}_{t} = ν_{t} + θ_{1} ν_{t - 1}

$Y_t=\nu_t+\theta_{1}\nu_{t-1}$

{Oui}_{t} = ρ {Oui}_{t - 1} + ν_{t} = ν_{t} + ρ ν_{t - 1} + ρ^{2} ν_{t - 1} + . . .

$Y_t=\rho Y_{t-1}+\nu_{t}=\nu_t+\rho \nu_{t-1}+ \rho^2 \nu_{t-1}+...$

on peut dire que les termes d'erreur dans les modèles ARMA expliquent l'influence "à court terme" du passé, et les termes décalés expliquent l'influence "à long terme". Cela dit, je ne pense pas que cela aide beaucoup et généralement personne ne se soucie de l'interprétation précise des coefficients ARMA. Le but est généralement d'obtenir un modèle adéquat et de l'utiliser pour la prévision.

— mpiktas
source

+1 C'est plus ou moins ce que j'essayais de comprendre dans mes commentaires ci-dessus.

— Graeme Walsh

Ha, je n'ai pas vu vos commentaires lorsque j'écrivais la réponse. Je suggère de les convertir en réponse.

— mpiktas

$n$ $c_1,c_2,...,c_n$

Oui (t) = c_{1} Oui (t - 1) + c_{2} Oui (t - 2) + c_{3} Oui (t - 3) + . . . + c_{n} Oui (t - n) + une (t)

$Y(t) =c_1 Y(t−1) + c_2 Y(t-2) + c_3 Y(t-3)+ ... + c_n Y(t-n) + a(t)$

De cette façon, un modèle ARIMA peut être expliqué comme la réponse à la question

Combien de valeurs historiques dois-je utiliser pour calculer une somme pondérée du passé?
Quelles sont précisément ces valeurs?

— IrishStat
source