Les méthodes à fréquence mixte consistent généralement à utiliser les données de fréquence supérieure (ticks boursiers, etc.) pour prévoir la fréquence inférieure (GDP, dans un exemple exagéré pour la disparité de fréquence de contrainte). C'est peut-être une réponse très simple / évidente, mais parce que je n'ai pas réussi à trouver le but opposé abordé dans les publications (un excellent guide pour cette littérature est: http://www.uclouvain.be/cps/ ucl / doc / ssh-ilsm / images / MIDAS_Course_Syllabus_NBB.pdf), Je ne suis tout simplement pas sûr de ce que je peux faire pour combiner deux jeux de données à des fréquences différentes avant que toute série chronologique ne fonctionne. Il est possible que cela soit abordé dans la littérature répertoriée dans le lien ci-dessus, et je ne l'ai tout simplement pas vu. Mais l'objectif semble toujours aller dans une direction: prévoir des données à basse fréquence avec une fréquence plus élevée.
Que se passe-t-il si je veux prendre en compte la possibilité d'effets bidirectionnels endogènes et essayer de prévoir la fréquence supérieure en fonction de la fréquence inférieure?
Voir à partir de http://rady.ucsd.edu/faculty/directory/valkanov/pub/docs/midas-touch.pdf :
"De manière générale, l’intérêt pour les régressions MIDAS s’applique à une situation fréquente dans laquelle les informations pertinentes sont des données à haute fréquence, tandis que la variable considérée est échantillonnée à une fréquence plus basse. Un exemple concerne les modèles de volatilité des marchés boursiers. La variable basse fréquence correspond par exemple à la variation quadratique ou à un autre processus de volatilité sur un horizon à long terme correspondant à la date d'échéance d'une option, alors que l'ensemble de données à haute fréquence est une information de marché passée potentiellement au niveau tick-by-tick. "
Voir également le même article: "Prenons, par exemple, la relation entre inflation et croissance. Au lieu d’agréger la série d’inflation sur une fréquence d’échantillonnage trimestrielle afin de faire correspondre les données du PIB, on peut exécuter une régression MIDAS combinant des données mensuelles et trimestrielles."
Et le contraire? IE, si j'ai un jeu de données sur l'inflation:
YearQ Inflation
2006Q1 3
2006Q2 3.5
2006Q3 3
2006Q4 3.5
2007Q1 3.5
2007Q2 3.4
2007Q3 3.4
2007Q4 3.4
Et un ensemble de données du PIB:
Year GDP
2006 3
2007 3.1
Puis-je simplement combiner les 2 comme ça? (vraiment facile car c'est juste une simple jointure, donc attrayant pour moi pour cette raison quand il s'agit d'exemples plus compliqués de la même chose)
YearQ Inflation GDP
2006Q1 3 3 3
2006Q2 3.5 3
2006Q3 3 3 3
2006Q4 3.5 3
2007Q1 3.5 3.1
2007Q2 3.4 3.1
2007Q3 3.4 3.1
2007Q4 3.4 3.1
Puis-je maintenant essayer de modéliser l'inflation avec RU-MIDAS / VAR / ETS / ARIMA / GARCH / VECM / peu importe? Cela me semble encore maladroit. Il serait même utile que quelqu'un puisse simplement vérifier pour moi: "oui, c'est a) couvert par la littérature, et b) ce n'est pas une quête sans valeur conceptuelle d'essayer de prédire les hautes fréquences avec des données à basse fréquence".
Ainsi, à partir du même document d’introduction de base que j'ai cité précédemment, après avoir introduit l’équation de base de MIDAS: "L’exemple annuel / trimestriel impliquerait que l’équation ci-dessus est une projection de Yt annuel sur des données trimestrielles X (m) t utilisant jusqu'à j max trimestrielle. "Cela ressemble à ce que je veux - mais la formulation consiste à faire en sorte que la variable indépendante (ignorer le temps pour un moment) soit toujours la fréquence la plus élevée. Dois-je simplement inverser l'équation à ce stade pour ce que je veux ("résoudre pour x", littéralement)?
Edit: Nous avons trouvé un document de travail très récent de la Norges Bank (je ne peux pas publier plus de 2 liens, google "Utilisation des informations de basse fréquence pour prédire les variables de haute fréquence"), ce qui est plutôt bon. La revue éclairée d’approches référencées telles que MF-VAR devrait également être utile. Il ressort de cet article que mon approche est théoriquement acceptable dans l’abstrait, même si je devrais utiliser une interpolation plus intelligente des données basse fréquence vers le jeu de données haute fréquence, comme les splines cubiques dans la fonction SAS "PROC EXPAND". Certaines personnes, comme Marc Wildi, utilisent le même exemple exagéré de PIB que la variable de basse fréquence pour argumenter que le cas d'utilisation que je propose est moins utile que le contraire traditionnel. Il a des méthodes d'extraction de signal MDFA intéressantes que je ne connais pas.