Question: Je veux être sûr de quelque chose, l’utilisation de la validation croisée à plis multiples avec des séries chronologiques est-elle simple, ou faut-il être particulièrement attentif avant de l’utiliser?
Contexte: Je modélise une série chronologique sur 6 ans (avec une chaîne semi-markovienne), avec un échantillon de données toutes les 5 min. Pour comparer plusieurs modèles, j'utilise une validation croisée de 6 fois en séparant les données en 6 ans. Mes ensembles de formation (pour calculer les paramètres) ont une durée de 5 ans et les ensembles de test ont une longueur de 1. année. Je ne prends pas en compte l'ordre des temps, mes différents sets sont:
- fold 1: entraînement [1 2 3 4 5], test [6]
- fold 2: entraînement [1 2 3 4 6], test [5]
- fold 3: entraînement [1 2 3 5 6], test [4]
- fold 4: entraînement [1 2 4 5 6], test [3]
- fold 5: entraînement [1 3 4 5 6], test [2]
- pli 6: entraînement [2 3 4 5 6], test [1].
Je fais l'hypothèse que chaque année sont indépendantes les unes des autres. Comment puis-je vérifier cela? Existe-t-il une référence montrant l'applicabilité de la validation croisée à plis multiples avec des séries chronologiques?