Google Trends renvoie des données hebdomadaires, je dois donc trouver un moyen de les fusionner avec mes données quotidiennes / mensuelles.
Ce que j'ai fait jusqu'à présent, c'est de décomposer chaque série en données quotidiennes, par exemple:
de:
2013-03-03 - 2013-03-09 37
à:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
Mais cela ajoute beaucoup de complexité à mon problème. J'essayais de prédire les recherches google à partir des valeurs des 6 derniers mois, ou 6 valeurs dans les données mensuelles. Les données quotidiennes impliqueraient un travail sur 180 valeurs passées. (J'ai 10 ans de données donc 120 points en données mensuelles / 500+ en données hebdomadaires / 3500+ en données quotidiennes)
L'autre approche consisterait à «fusionner» les données quotidiennes avec les données hebdomadaires / mensuelles. Mais certaines questions découlent de ce processus. Certaines données peuvent être moyennées car leur somme représente quelque chose. Précipitations par exemple, la quantité de pluie dans une semaine donnée sera la somme des quantités pour chaque jour composant les semaines.
Dans mon cas, je traite des prix, des taux financiers et d'autres choses. Pour les prix, il est courant dans mon domaine de prendre en compte le volume échangé, donc les données hebdomadaires seraient une moyenne pondérée. Pour les taux financiers, c'est un peu plus complexe car certaines formules sont impliquées pour construire des taux hebdomadaires à partir des taux journaliers. Pour les autres choses, je ne connais pas les propriétés sous-jacentes. Je pense que ces propriétés sont importantes pour éviter des indicateurs dénués de sens (une moyenne des taux fianciers serait un non-sens par exemple).
Donc trois questions:
Pour les propriétés connues et inconnues, comment dois-je procéder pour passer des données quotidiennes aux données hebdomadaires / mensuelles?
J'ai l'impression que la décomposition des données hebdomadaires / mensuelles en données quotidiennes comme je l'ai fait est quelque peu erronée car j'introduis des quantités qui n'ont aucun sens dans la vraie vie. Donc presque la même question:
Pour les propriétés connues et inconnues, comment dois-je procéder pour passer des données hebdomadaires / mensuelles aux données quotidiennes?
Dernier point mais non des moindres: lorsque l'on donne deux séries chronologiques avec des pas de temps différents, quoi de mieux: utiliser le pas de temps le plus bas ou le plus grand? Je pense que c'est un compromis entre le nombre de données et la complexité du modèle, mais je ne vois aucun argument solide pour choisir entre ces options.
Edit: si vous connaissez un outil (en R Python voire Excel) pour le faire facilement ce serait très apprécié.