Est-il préférable de différencier une série (en supposant qu'elle en ait besoin) avant d'utiliser un Arima OU mieux d'utiliser le paramètre d dans Arima?
J'ai été surpris de voir à quel point les valeurs ajustées diffèrent selon l'itinéraire emprunté avec le même modèle et les mêmes données. Ou est-ce que je fais quelque chose de mal?
install.packages("forecast")
library(forecast)
wineindT<-window(wineind, start=c(1987,1), end=c(1994,8))
wineindT_diff <-diff(wineindT)
#coefficients and other measures are similar
modA<-Arima(wineindT,order=c(1,1,0))
summary(modA)
modB<-Arima(wineindT_diff,order=c(1,0,0))
summary(modB)
#fitted values from modA
A<-forecast.Arima(modA,1)$fitted
#fitted from modB, setting initial value to the first value in the original series
B<-diffinv(forecast.Arima(modB,1)$fitted,xi=wineindT[1])
plot(A, col="red")
lines(B, col="blue")
AJOUTER:
Veuillez noter que je différencie la série une fois et que j'adapte arima (1,0,0), puis j'adapte arima (1,1,0) à la série d'origine. Je suis (je pense) inversant la différenciation sur les valeurs ajustées pour l'arima (1,0,0) sur le fichier différencié.
Je compare les valeurs ajustées - pas les prédictions.
Voici l'intrigue (le rouge est l'arima (1,1,0) et le bleu est l'arima (1,0,0) sur la série différenciée après être revenu à l'échelle d'origine):
Réponse à la réponse du Dr Hyndman:
1) Pouvez-vous illustrer dans le code R ce que je devrais faire pour obtenir les deux valeurs ajustées (et probablement les prévisions) pour correspondre (en tenant compte d'une petite différence en raison de votre premier point dans votre réponse) entre Arima (1,1, 0) et Arima (1,0,0) sur la série différenciée manuellement? Je suppose que cela a à voir avec le fait que la moyenne n'est pas incluse dans modA, mais je ne sais pas trop comment procéder.
2) Concernant votre # 3. Je sais que je manque l'évidence, mais je ne suis pas et identique quand est défini comme ? Êtes-vous en train de dire que je «fais la différence» de manière incorrecte? Y t=φ(Xt-1-Xt-2) Y t X t-Xt-1