Je voudrais configurer un algorithme pour détecter une anomalie dans les séries temporelles, et je prévois d'utiliser le clustering pour cela.
Pourquoi devrais-je utiliser une matrice de distance pour le clustering et non les données brutes des séries temporelles ?,
Pour la détection de l'anomalie, j'utiliserai un clustering basé sur la densité, un algorithme comme DBscan, alors cela fonctionnerait-il dans ce cas? Existe-t-il une version en ligne pour le streaming de données?
Je voudrais détecter l'anomalie avant qu'elle ne se produise, alors, utiliser un algorithme de détection de tendance (ARIMA) serait-il un bon choix?