Quel est le meilleur test statistique pour une série chronologique?

J'ai une série chronologique simple avec 5 à 10 points de données par ensemble de données à intervalles réguliers. Je me demande quelle est la meilleure façon de déterminer si deux ensembles de données sont différents. Dois-je essayer des tests t sur chaque point de données, ou regarder la zone sous les courbes ou existe-t-il une sorte de modèle multivarié qui fonctionnerait mieux?

time-series statistical-significance

— Dave
source

Qu'entendez-vous par «différent»?

— Shane

Que voulez-vous dire par "5-10 points de données par ensemble de données "?

— S.Kolassa - Rétablir Monica

Je pense qu'il a une collection de plusieurs séries chronologiques, chacune avec 5-10 observations.

— Rob Hyndman

Je pense toujours qu'il est presque impossible de répondre à cette question sans comprendre ce que signifie "différent" ...

— Shane

Mes applogies pour la question mal formulée. Par différent, je veux dire si au cours de la série chronologique (plutôt qu'à des points individuels) il y a une différence entre deux groupes de traitement. Il y aurait des variations inter-sujets (qui, je suppose, devraient être prises en compte) ainsi que des variations inter-groupes (ce qui m'intéresse).

— Dave

Réponses:

Vous devrez spécifier précisément ce que vous entendez par «différent». Vous devrez également spécifier les hypothèses que vous êtes prêt à faire sur la structure de corrélation en série dans chaque série chronologique.

Avec les tests t, vous comparez la moyenne de chaque groupe et vous supposez que les groupes sont constitués d'observations indépendantes avec des variances égales (cette dernière est parfois détendue). Lors du test de séries chronologiques, l'hypothèse d'indépendance n'est généralement pas raisonnable, mais vous devez ensuite la remplacer par une structure de corrélation spécifiée - par exemple, vous pouvez supposer que les séries chronologiques suivent les processus AR (1) avec une autocorrélation égale. Par conséquent, même la comparaison des moyennes de deux séries chronologiques ou plus est considérablement plus difficile qu'avec des données indépendantes.

Je préciserais soigneusement les hypothèses que je voulais faire sur chaque série chronologique et ce que je souhaitais comparer, puis j'utiliserais un bootstrap paramétrique (basé sur le modèle supposé) pour effectuer le test.

— Rob Hyndman
source

Peut-être que vous voulez des mesures répétées anova. Il vous permet de comparer les sujets (facteurs inter-sujets) tout en prenant la structure corrélée des "séries chronologiques" par sujet (facteur intra-sujet). C'est une méthode simple mais datée et qui peut être trouvée dans le contexte des "modèles linéaires généraux", elle a besoin de quelques fonctionnalités supplémentaires (par exemple la sphéricité). Une autre façon pourrait être des modèles linéaires mixtes qui permettent des structures de corrélations plus générales (même AR (1) comme Rob l'a suggéré) et des données déséquilibrées.

— psj
source

Si vous voulez supposer une tendance linéaire simple, vous pouvez prendre la différence de chaque ensemble de données aux différents points dans le temps et tester que la pente de la ligne est nulle.

-Ralph Winters