J'utilise une série chronologique quotidienne de données de vente qui contient environ 2 ans de points de données quotidiens. Sur la base de certains tutoriels / exemples en ligne, j'ai essayé d'identifier la saisonnalité des données. Il semble qu'il y ait une périodicité / saisonnalité hebdomadaire, mensuelle et probablement annuelle.
Par exemple, il existe des jours de paie, en particulier le 1er jour de paie du mois qui dure quelques jours au cours de la semaine. Il existe également des effets spécifiques de vacances, clairement identifiables en notant les observations.
Équipé de certaines de ces observations, j'ai essayé ce qui suit:
ARIMA (avec
Arima
et àauto.arima
partir du package de prévisions R), en utilisant le régresseur (et d'autres valeurs par défaut nécessaires dans la fonction). Le régresseur que j'ai créé est essentiellement une matrice de valeurs 0/1:- Variables à 11 mois (n-1)
- 12 variables de vacances
- Impossible de comprendre la partie paie ... car c'est un effet un peu plus compliqué que je ne le pensais. L'effet de paie fonctionne différemment, selon le jour de semaine du 1er du mois.
J'ai utilisé 7 (c'est-à-dire la fréquence hebdomadaire) pour modéliser la série chronologique. J'ai essayé le test - prévoyant 7 jours à la fois. Les résultats sont raisonnables: la précision moyenne pour une prévision de 11 semaines s'élève à RMSE hebdomadaire moyenne à 5%.
Modèle TBATS (de l'ensemble de prévisions R) - utilisant la saisonnalité multiple (7, 30,4375, 365,25) et évidemment aucun régresseur. La précision est étonnamment meilleure que le modèle ARIMA à une moyenne hebdomadaire de RMSE de 3,5%.
Dans ce cas, le modèle sans erreur ARMA fonctionne légèrement mieux. Maintenant, si j'applique les coefficients pour seulement les effets de vacances du modèle ARIMA décrit dans # 1, aux résultats du modèle TBATS, le RMSE moyen hebdomadaire s'améliore à 2,95%
Maintenant, sans avoir beaucoup d'expérience ou de connaissances sur les théories sous-jacentes de ces modèles, je suis dans un dilemme si cette approche TBATS est même valable. Même s'il améliore considérablement le RMSE au cours du test de 11 semaines, je me demande s'il peut maintenir cette précision à l'avenir. Ou même si l'application des effets de vacances d'ARIMA au résultat TBATS est justifiable. Toutes les pensées de tous / de tous les contributeurs seront très appréciées.
Remarque: effectuez "Enregistrer le lien sous" pour télécharger le fichier.