Comment démarrez-vous avec des données de séries chronologiques?


33

J'ai récemment appris à utiliser des techniques d'amorçage pour calculer les erreurs standard et les intervalles de confiance pour les estimateurs. Ce que j'ai appris, c'est que si les données sont des IID, vous pouvez traiter les données de l'échantillon comme la population et faire un échantillonnage avec remplacement, ce qui vous permettra d'obtenir plusieurs simulations d'une statistique de test.

Dans le cas des séries chronologiques, vous ne pouvez clairement pas le faire car une autocorrélation est susceptible d'exister. J'ai une série chronologique et je voudrais calculer la moyenne des données avant et après une date fixe. Existe-t-il un moyen correct de le faire en utilisant une version modifiée de l'amorçage?


16
Terme de recherche clé: Block bootstrap.
cardinal du

Réponses:


26

Comme le souligne @cardinal, les variations du «block bootstrap» sont une approche naturelle. Ici, selon la méthode, vous sélectionnez des tronçons de la série chronologique, qui se chevauchent ou non et de longueur fixe ou aléatoire, ce qui peut garantir la stationnarité dans les échantillons ( Politis et Romano, 1991 ), puis les recoudre pour créer des séries temporelles rééchantillonnées sur lequel vous calculez votre statistique. Vous pouvez également essayer de construire des modèles des dépendances temporelles, conduisant aux méthodes de Markov, aux tamis autorégressifs et autres. Mais l'amorçage de blocs est probablement la plus simple de ces méthodes à implémenter.

Gonçalves et Politis (2011) est une très courte revue avec références. Un traitement de longueur de livre est Lahiri (2010) .


@statnub Si cela est lié à votre précédente question d'intervention hebdomadaire sur les ventes, notez que vous amorceriez si vous ne faisiez pas confiance aux hypothèses du modèle que vous y déployiez. En premier lieu, l'utilisation d'un modèle de séries chronologiques justifiable devrait idéalement minimiser le risque de choses qui indiqueraient ce type de bootstrapping ...
conjugateprior

6
Bonne réponse. Permettez-moi d'ajouter que vous pouvez utiliser tsbootle bootpackage dans R pour ce faire.
MånsT

@ MånsT Nice. Je ne connaissais pas ce paquet.
conjugateprior

5

X1,···,XnX1,X2,···,Xn

Le rééchantillonnage basé sur un modèle est facilement adapté aux séries chronologiques. Les rééchantillons sont obtenus en simulant le modèle de série chronologique. Par exemple, si le modèle est ARIMA (p, d, q), les rééchantillons d'un modèle ARIMA (p, q) avec des MLE (de la série différenciée) des coefficients moyens autorégressifs et mobiles et la variance du bruit. Les rééchantillons sont les séquences de somme partielle du processus ARIMA simulé (p, q).

Le rééchantillonnage sans modèle des séries chronologiques est réalisé par rééchantillonnage par blocs, également appelé bloc bootstrap, qui peut être implémenté à l'aide de la fonction tsboot dans le package de démarrage de R. L'idée est de diviser la série en blocs d'observations consécutives de longueur à peu près égale, de rééchantillonner le bloc avec remplacement, puis de coller les blocs ensemble. Par exemple, si la série chronologique est de longueur 200 et que l'on utilise 10 blocs de longueur 20, alors les blocs sont les 20 premières observations, les 20 suivantes, etc. Un rééchantillonnage possible est le quatrième bloc (observation 61 à 80), puis le dernier bloc (observation 181 à 200), puis le deuxième bloc (observation 21 à 40), puis le quatrième bloc à nouveau, et ainsi de suite jusqu'à ce qu'il y ait 10 blocs dans le rééchantillonnage.


1
Il existe d'autres formes de méthodes de bootstrap de bloc, y compris le bootstrap de bloc qui se chevauchent et le bootstrap de bloc circulaire, qui sont décrites en détail dans le livre de Lahiri (2003) "Resampling Methods for Dependent Data". Ces méthodes sont applicables aux séries chronologiques stationnaires.
Michael R. Chernick
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.