J'ai une grande collection de séries chronologiques - des mesures prises toutes les 15 minutes (96 mesures par jour) sur une période d'un an à différents endroits.
J'ai divisé chaque série chronologique en 365 séries chronologiques plus petites distinctes, 1 pour chaque jour de l'année. En regardant ces séries chronologiques, il existe certainement de nombreuses formes distinctes pour une seule journée. Certains semblent sinusoïdaux, certains sont constants, certains ressemblent à un processus stochastique aléatoire, certains semblent paraboliques et certains ressemblent à des U.
Ce que je voudrais faire, c'est utiliser un algorithme qui peut trouver ces formes courantes. J'ai pensé au clustering et à l'utilisation des centroïdes de cluster pour définir des formes communes, mais je voulais vérifier auprès de la communauté si cela était vrai. Jusqu'à présent, j'ai considéré Dynamic Time Warp comme une métrique, mais il semble que cette métrique nécessite beaucoup de calculs. J'ai aussi trouvé
http://mox.polimi.it/it/progetti/pubblicazioni/quaderni/13-2008.pdf de SE.
J'ai également vu Est-il possible de faire un regroupement de séries temporelles en fonction de la forme de la courbe? mais cette question date de 2010 et pourrait être dépassée.
Une autre idée que j'ai eue était de prendre des compositions de matrices qui étaient formatées comme suit:
La matrice est une matrice de toutes les séries chronologiques observées au jour . Chaque ligne de la matrice est une série chronologique de longueur 96. Ensuite, je ferais 365 compositions de composition numérique et j'utiliserais les vecteurs propres comme formes courantes. Cela vous semble-t-il raisonnable?
Merci!