Actuellement, je travaille sur un projet de prévision d'une série chronologique (données mensuelles). J'utilise R pour faire les prévisions. J'ai 1 variable dépendante (y) et 3 variables indépendantes (x1, x2, x3). La variable y a 73 observations, tout comme les 3 autres variables (alos 73). De janvier 2009 à janvier 2015. J'ai vérifié les corrélations et la valeur de p, et c'est très important de le mettre dans un modèle. Ma question est: comment puis-je faire une bonne prédiction en utilisant toutes les variables indépendantes? Je n'ai pas de valeurs futures pour ces variables. Disons que je voudrais prédire quelle sera ma variable y sur plus de 2 ans (en 2017). Comment puis-je faire ceci?
J'ai essayé le code suivant:
model = arima(y, order(0,2,0), xreg = externaldata)
Puis-je faire une prédiction de la valeur y sur 2 ans avec ce code?
J'ai également essayé un code de régression:
reg = lm(y ~ x1 + x2 + x3)
Mais comment prendre le temps dans ce code? Comment puis-je prévoir la valeur de ma valeur y, disons 2 ans? Je suis nouveau dans les statistiques et les prévisions. J'ai effectué quelques lectures et observations sur la valeur de décalage, mais comment puis-je utiliser une valeur de décalage dans le modèle pour effectuer des prévisions?
En fait, ma question globale est de savoir comment puis-je prévoir des données de série chronologique avec des variables externes sans valeur future?