Je travaille beaucoup avec les modèles de séries temporelles financières, principalement AR (I) MA et Kalman.
Un problème auquel je continue de faire face est la fréquence d'échantillonnage. Au départ, je pensais que si on m'offrait la possibilité d'échantillonner plus fréquemment à partir d'un processus sous-jacent, je devrais échantillonner aussi souvent que possible afin d'avoir un nombre beaucoup plus élevé d'échantillons, donc mes paramètres de modèle auront moins de variation.
En réalité, cette idée ne s'est pas avérée bonne. Ce qui s'est passé, c'est que si le processus sous-jacent ne présente pas suffisamment de variations, l'augmentation de la fréquence d'échantillonnage signifiait en fait obtenir beaucoup de (mêmes) valeurs répétitives. Et construire un modèle sur de telles valeurs donne des modèles avec de très très petits coefficients de modèle qui ne prédisent pas bien dans le futur (bien sûr, la définition de "bien" est subjective et une fréquence accrue nécessite de prévoir beaucoup plus d'échantillons dans le futur pour atteindre le même pas de temps dans un réglage de fréquence plus faible). Le modèle apprend ce qu'il rencontre le plus - une ligne plate.
Je voulais faire une approche d'échantillonnage adaptatif, c'est-à-dire échantillonner plus fréquemment lorsqu'il y a variation et moins fréquemment lorsqu'il n'y en a pas. Mais ce n'est pas facile. Tout d'abord, le type de biais que j'introduisais n'est pas clair (et variera selon la façon dont je déclenche l'échantillon / saut). Deuxièmement, les modèles de séries temporelles comme ARIMA ne sont pas bien adaptés aux étapes d'échantillonnage inégales.
Existe-t-il un bon moyen de résoudre ce problème? Cela me fait également me demander comment on parvient à une transition transparente entre les modèles temporels continus et les modèles temporels discrets si les modèles sont si fortement affectés par la fréquence d'échantillonnage (en particulier lorsque les pas de temps deviennent de plus en plus petits)? Tout pointeur vers des ressources externes sera également apprécié.
Merci