Le problème ici est d'arriver à une équation qui analyse les données observées en signal et bruit. Si vos données sont simples, votre approche de régression pourrait fonctionner. Il faut prendre soin de comprendre certaines des hypothèses qu'ils font avec Prophète. Vous devriez mieux comprendre ce que fait Prophet, car il ne convient pas seulement à un modèle simple mais tente d'ajouter une certaine structure.
Par exemple, certaines réflexions que j'ai faites après avoir lu leur introduction bien écrite pourraient vous aider dans votre évaluation. Je m'excuse à l'avance si j'ai mal compris leur approche et j'aimerais être corrigé le cas échéant.
1) Leur exemple principal a deux points de rupture dans la tendance mais ils n'ont capturé que le plus évident.
2) Ils ignorent toute structure ARIMA reflétant des séries stochastiques omises ou la valeur de l'utilisation des valeurs historiques de Y pour guider la prévision.
3) Ils ignorent toute dynamique possible (effets de plomb et de retard) des séries stochastiques et déterministes suggérées par l'utilisateur. Les effets de régression causale du Prophète sont simplement contemporains.
4) Aucune tentative n'est faite pour identifier les changements de pas / niveau dans la série ou les impulsions saisonnières, par exemple un changement de l'EFFET DU LUNDI à mi-parcours en raison d'un événement externe inconnu. Prophet suppose une «croissance linéaire simple» plutôt que de la valider en examinant d'autres possibilités. Pour un exemple possible de cela, voir Prévision des commandes récurrentes pour une entreprise d'abonnement en ligne en utilisant Facebook Prophet et R
5) Les sinus et les cosinus sont un moyen opaque de gérer la saisonnalité, tandis que les effets saisonniers tels que le jour de la semaine, le jour du mois, la semaine du mois, le mois de l'année sont beaucoup plus efficace / informatif lorsqu'il s'agit d'effets anthropiques (avec les humains!).
Suggérer des fréquences de 365,25 pour les schémas annuels n'a pas de sens car nous n'effectuons pas la même action le même jour que l'année dernière, alors que l'activité mensuelle est beaucoup plus persistante, mais Prophet ne semble pas offrir les 11 indicateurs mensuels option. Les fréquences hebdomadaires de 52 n'ont pas beaucoup de sens car nous n'avons pas 52 semaines chaque année.
6) Aucune tentative n'est faite pour valider les processus d'erreur étant gaussiens, des tests significatifs de signification peuvent donc être effectués.
7) Aucun souci que la variance d'erreur du modèle soit homogène, c'est-à-dire ne changeant pas de façon déterministe à des moments particuliers, ce qui suggère des moindres carrés pondérés. Pas de souci pour trouver une transformée de puissance optimale pour traiter la variance d'erreur étant proportionnelle à la valeur attendue Quand (et pourquoi) devriez-vous prendre le log d'une distribution (de nombres)? .
8) L'utilisateur doit prédéfinir tous les effets possibles de plomb et de retard autour des événements / vacances. Par exemple, les ventes quotidiennes commencent souvent à augmenter fin novembre, reflétant un effet à long terme de Noël.
9) Aucune préoccupation quant au fait que les erreurs qui en résultent sont exemptes de structure, ce qui suggère des moyens d'améliorer le modèle via une vérification diagnostique de la suffisance.
10) Apparemment, aucun souci d'améliorer le modèle en supprimant la structure non significative.
11) Il n'est pas possible d'obtenir une famille de prévisions simulées où les limites de confiance ne sont pas nécessairement symétriques en amorçant les erreurs du modèle en tenant compte des éventuelles anomalies.
12) Laisser l'utilisateur faire des hypothèses sur les tendances (nombre de points de rupture de tendance et les points de rupture réels) permet une flexibilité indésirable / inutilisable face à une analyse à grande échelle qui, par son nom, est conçue pour les applications à grande échelle mains libres.