Plusieurs modèles ARIMA correspondent bien aux données. Comment déterminer la commande? Approche correcte?

J'ai deux séries chronologiques (paramètres d'un modèle pour hommes et femmes) et vise à identifier un modèle ARIMA approprié afin de faire des prévisions. Ma série chronologique ressemble à:

entrez la description de l'image ici

L'intrigue et l'ACF montrent non stationnaire (les pointes de l'ACF se coupent très lentement). Ainsi, j'utilise la différenciation et j'obtiens:

entrez la description de l'image ici

Ce graphique indique que la série pourrait maintenant être stationnaire et l'application du test kpss et du test adf corrobore cette hypothèse.

En commençant par la série Homme, nous faisons les observations suivantes:

Les autocorrélations empiriques aux décalages 1, 4, 5, 26 et 27 sont significativement différentes de zéro.
L'ACF coupe (?), Mais je suis préoccupé par les pics relativement importants des décalages 26 et 27.
Seules les autocorrélations partielles empiriques aux décalages 1 et 2 sont significativement différentes de zéro.

Sur la base de ces seules observations, si je devais choisir un modèle AR ou MA pur pour la série chronologique différenciée, j'aurais tendance à choisir un modèle AR (2) en faisant valoir que:

Nous n'avons pas d'autocorrélations partielles significatives pour un décalage supérieur à 2
L'ACF s'arrête, sauf pour la région autour du décalage 27. (Ces quelques valeurs aberrantes sont-elles à elles seules un indicateur qu'un modèle ARMA mixte serait approprié?)

ou un modèle MA (1) en faisant valoir que:

Le PACF coupe clairement
Nous n'avons pour les retards supérieurs à 1 que 4 pointes dépassant la valeur critique en magnitude. Il s'agit "seulement" d'un de plus que des 3 pics (95% sur 60) qui seraient autorisés à se situer en dehors de la zone pointillée.

Il n'y a pas de caractéristique d'un modèle ARIMA (1,1,1) et le choix des ordres de p et q d'un modèle ARIMA sur la base de ACF et PACF pour p + q> 2 devient difficile.

L'utilisation de auto.arima () avec le critère AIC (Dois-je utiliser AIC ou AICC?) Donne:

ARIMA (2,1,1) avec dérive; AIC = 280,2783
ARIMA (0,1,1) avec dérive; AIC = 280,2784
ARIMA (2,1,0) avec dérive; AIC = 281,437

Les trois modèles considérés montrent des résidus de bruit blanc:

entrez la description de l'image ici

Mes questions résumées sont:

Pouvez-vous toujours décrire l'ACF de la série chronologique comme une coupure malgré les pointes autour du décalage 26?
Ces valeurs aberrantes indiquent-elles qu'un modèle ARMA mixte pourrait être plus approprié?
Quel critère d'information dois-je choisir? AIC? AICC?
Les résidus des trois modèles avec l'AIC le plus élevé montrent tous un comportement de bruit blanc, mais la différence dans l'AIC n'est que très faible. Dois-je utiliser celui avec le moins de paramètres, c'est-à-dire un ARIMA (0,1,1)?
Mon argumentation est-elle généralement plausible?
Leurs autres possibilités sont-elles de déterminer quel modèle pourrait être le meilleur ou devrais-je, par exemple, les deux avec l'AIC le plus élevé et effectuer des backtests pour tester la plausibilité des prévisions?

EDIT: Voici mes données:

-5.9112948202 -5.3429985122 -4.7382340534 -3.1129015623 -3.0350910288 -2.3218904871 -1.7926701792 -1.1417358384 -0.6665592055 -0.2907748318 0.2899480865 0.4637205370  0.5826312749  0.3869227286  0.6268379174  0.7439125292 0.7641139207  0.7613140511  3.0143912244 -0.7339255839  2.0109976796 0.8282394650 -2.5668367983  5.9826406394  1.9569198553  2.3860893476 2.0883339390  1.9761894580  2.2601997245  2.2464027995  2.5131158613 3.4564765529  4.2307335557  4.0298688374  3.7626317439  3.1026407174 2.1690168737  1.5617407254  2.6790460788  0.4652054768 -0.0501046517 -1.0157683791 -0.5113698054 -0.0180401353 -1.9471272198 -0.2550365250 -1.1269988523  0.5152074134  0.2362626753 -2.9978337017  1.4924705528 -1.4907767844 -0.5492041416 -0.7313021018 -0.6531515868 -0.4094159299 -0.5525401626 -0.0611454515 -0.5256272882 -1.1235247363 -1.7299848758 -1.3807763611 -1.6999054476 -4.3155973110 -4.7843298990

— Stats_L
source

1) Pouvez-vous toujours décrire l'ACF de la série chronologique comme une coupure malgré les pointes autour du décalage 26?

26 et 27 me suggèrent que les données sont hebdomadaires une sorte de cycle annuel pf ordre 26 ou 52

Ces valeurs aberrantes indiquent-elles qu'un modèle ARMA mixte pourrait être plus approprié?

S'il y a des valeurs aberrantes dans la série observée, le modèle ARIMA devient un modèle de fonction de transfert avec des entrées factices.

Les valeurs aberrantes de l'acf / pacf sont généralement non interprétables. Utiliser ensuite l'acf / paf d'un modèle provisoire suggéré par le dominant acf / pacf abd puis ITERATE pour un modèle plus complexe.

Quel critère d'information dois-je choisir? AIC? AICC? Les résidus des trois modèles avec l'AIC le plus élevé montrent tous un comportement de bruit blanc, mais la différence dans l'AIC n'est que très faible. Dois-je utiliser celui avec le moins de paramètres, c'est-à-dire un ARIMA (0,1,1)?

Aucun car il est basé sur un ensemble d'essai de modèles supposés.

Mon argumentation est-elle généralement plausible? Question vague ... réponse encore plus vague.

Leurs autres possibilités sont-elles de déterminer quel modèle pourrait être le meilleur ou devrais-je, par exemple, les deux avec l'AIC le plus élevé et effectuer des backtests pour tester la plausibilité des prévisions?

Itérer simplement (lentement!) Vers des modèles plus / moins compliqués incorporant à la fois une structure auto-régressive et une structure déterministe. Voir http://www.autobox.com/cms/index.php/blog/entry/build-or-make-your-own-arima-forecasting-mode pour un diagramme de flux logique

MODIFIER APRÈS RÉCEPTION DES DONNÉES:

J'ai été induit en erreur par votre commentaire, vous avez utilisé le mot décalage de 26 et j'ai mal compris que vous parliez de l'acf mais vous parliez du point temporel 26. Un ensemble de données peut être non stationnaire de plusieurs façons. Si la moyenne change, le remède à cette non-stationnarité est la dé-signification. Dans votre cas, la non-stationnarité est causée par deux tendances distinctes et distinctes et une augmentation significative de la variance d'erreur. Ces deux résultats sont facilement supportés par l'œil. entrez la description de l'image ici

Vos données n'ont pas de stationnarité mais le remède à la non-stationnarité de vos données dans la moyenne n'est pas la différenciation mais la tendance à la baisse car deux tendances sont trouvées (1-29 et 30-65) trouvées via la détection d'intervention. De plus, votre variance d'erreur est non stationnaire, augmentant considérablement à la période 28 trouvée via le test de Tsay pour la variance d'erreur non constante, Voir cette référence pour les deux procédures http://www.unc.edu/~jbhill/tsay.pdf . Après ajustement pour les deux tendances et le changement de variance d'erreur et quelques impulsions, un modèle AR (1) simple s'est avéré adéquat. Voici le tracé de Réel / Ajustement / Prévision. L'équation entrez la description de l'image ici est ici avec les résultats d'estimation ici . Le test de changement de variance est ici et le tracé des résidus du modèle est ici. J'ai utilisé AUTOBOX, un logiciel que j'ai aidé à développer pour séparer automatiquement le signal du bruit. Votre ensemble de données est le «poster boy» pour expliquer pourquoi la modélisation ARIMA simple n'est pas largement utilisée car les méthodes simples ne fonctionnent pas sur des problèmes complexes. Notez bien que le changement de variance d'erreur n'est pas lié au niveau des séries observées, donc les transformations de puissance telles que les journaux ne sont pas pertinentes même si les articles publiés présentent des modèles utilisant cette structure. Voir Transformation de journal ou de racine carrée pour ARIMA pour une discussion sur le moment de prendre des transformations de puissance.

entrez la description de l'image ici

— IrishStat
source

Merci beaucoup pour les commentaires utiles. Malheureusement, la série chronologique représente les paramètres estimés d'un modèle (de mortalité) pour une série d'années. Ainsi, je ne pense pas que l'inclusion de composants saisonniers puisse résoudre ce problème. En ce qui concerne votre point de départ à partir d'un modèle provisoire simple, puis de l'itérer vers un modèle plus complexe: en regardant l'ACF et le PACF des résidus de l'ARIMA (0,1,1), ils montrent un comportement WN. Quel type de modèle me manque qui mettrait en évidence la nécessité d'un modèle plus complexe? Btw, je viens d'ajouter mes données.

— Stats_L

Merci beaucoup pour vos efforts et vos commentaires. Fait intéressant, les paramètres représentent un effet de cohorte des modèles de mortalité, qui ont généralement été modélisés comme un simple modèle ARIMA (p, d, q) dans la littérature, voir par exemple pensions-institute.org/workingpapers/wp0801.pdf

— Stats_L

Le mot clé ici est "simple". Les actuaires, bien que mathématiciens doués, ne sont pas nécessairement à la pointe de la technologie dans l'analyse des séries chronologiques. Une bonne analyse présente des tests de signification et de suffisance montrant des tests d'hypothèses. Vous pourriez transmettre ces résultats aux auteurs et obtenir leurs commentaires ou au moins le mérite d'avoir élargi leur conscience.

— IrishStat

Cela expliquerait pourquoi le choix d'un certain modèle ARIMA (p, d, q) est souvent basé uniquement sur les valeurs AIC (ou du moins d'autres examens ne sont pas mentionnés et décrits en détail). Si vous trouvez du temps dans les prochains jours, je serais très intéressé par votre avis sur ma deuxième série chronologique que je dois prévoir et si une marche aléatoire avec dérive pourrait être appropriée. Il peut être trouvé ici: stats.stackexchange.com/questions/161571/…

— Stats_L