Le problème que je traite est de prédire les valeurs de séries chronologiques. Je regarde une série chronologique à la fois et, sur la base par exemple de 15% des données d'entrée, je voudrais prédire ses valeurs futures. Jusqu'à présent, j'ai rencontré deux modèles:
- LSTM (mémoire à long terme et à court terme; classe de réseaux de neurones récurrents)
- ARIMA
J'ai essayé les deux et lu quelques articles sur eux. Maintenant, j'essaie de mieux comprendre comment comparer les deux. Ce que j'ai trouvé jusqu'à présent:
- LSTM fonctionne mieux si nous traitons une quantité énorme de données et si suffisamment de données de formation sont disponibles, alors qu'ARIMA est préférable pour des ensembles de données plus petits (est-ce correct?)
- ARIMA nécessite une série de paramètres
(p,q,d)
qui doivent être calculés en fonction des données, tandis que LSTM ne nécessite pas de définition de tels paramètres. Cependant, il existe certains hyperparamètres que nous devons régler pour LSTM. - EDIT: Une différence majeure entre les deux que j'ai remarqué en lisant un article ici , est que ARIMA ne pouvait fonctionner correctement sur les séries temporelles stationnaires (où il n'y a pas de saison, tendance et etc.) et vous devez prendre soin de si vouloir utiliser ARIMA
À part les propriétés susmentionnées, je ne pouvais trouver aucun autre point ou fait susceptible de m'aider à choisir le meilleur modèle. Je serais vraiment reconnaissant si quelqu'un pouvait m'aider à trouver des articles, des articles ou d'autres articles (je n'ai pas eu de chance jusqu'ici, seulement quelques opinions générales ici et là et rien n'est basé sur des expériences.)
Je dois mentionner que, à l'origine, je traite de la transmission en continu de données, mais pour l'instant, j'utilise des jeux de données NAB, qui incluent 50 jeux de données avec une taille maximale de 20 000 points de données.