Quelques mises en garde avant de continuer. Comme je le suggère souvent à mes étudiants, n'utilisez les auto.arima()
choses qu'en première approximation de votre résultat final ou si vous voulez avoir un modèle parcimonieux lorsque vous vérifiez que votre modèle basé sur la théorie rivale fait mieux.
Les données
Vous devez clairement partir de la description des données de séries chronologiques avec lesquelles vous travaillez. En macro-économétrie, vous travaillez généralement avec des données agrégées, et les moyennes géométriques (étonnamment) ont plus de preuves empiriques pour les données de macro-séries temporelles, probablement parce que la plupart d'entre elles se décomposent en une tendance à la croissance exponentielle .
Par ailleurs, la suggestion de Rob "visuellement" fonctionne pour les séries chronologiques avec une partie saisonnière claire , car les données annuelles variant lentement sont moins claires pour les augmentations de variation. Heureusement, une tendance à la croissance exponentielle est généralement observée (si elle semble linéaire, alors pas besoin de journaux).
Modèle
Si votre analyse est basée sur une théorie selon laquelle une moyenne géométrique pondérée plus connu sous le nom de modèle de régression multiplicative est celui avec lequel vous devez travailler. Ensuite, vous passez généralement à un modèle de régression log-logOui( t ) = Xα11( t ) . . . Xαkk( t ) ε ( t ) , qui est linéaire dans les paramètres et la plupart de vos variables, mais certains taux de croissance, sont transformés.
En économétrie financière, les journaux sont une chose courante en raison de la popularité des retours de journaux, car ...
Les transformations de journaux ont de belles propriétés
Dans le modèle de régression log-log c'est l'interprétation du paramètre estimé, disons comme l' élasticité de Y ( t ) sur X i ( t ) .αjeOui( t )Xje( t )
Dans les modèles à correction d'erreur, nous avons une hypothèse empiriquement plus forte selon laquelle les proportions sont plus stables ( stationnaires ) que les différences absolues.
En économétrie financière, il est facile d'agréger les log-retours dans le temps .
Il existe de nombreuses autres raisons non mentionnées ici.
finalement
Notez que la transformation logarithmique est généralement appliquée aux variables non négatives (niveau). Si vous observez les différences de deux séries temporelles (exportation nette, par exemple), il n'est même pas possible de prendre le journal, vous devez soit rechercher les données originales dans les niveaux, soit prendre la forme d'une tendance commune qui a été soustraite.
[ ajout après modification ] Si vous voulez toujours un critère statistique pour savoir quand effectuer la transformation du journal, une solution simple serait tout test d'hétéroscédasticité. En cas d'augmentation de la variance, je recommanderais le test de Goldfeld-Quandt ou similaire. Dans R, il est situé dans library(lmtest)
et est désigné par gqtest(y~1)
fonction. Régresser simplement sur le terme d'interception si vous n'avez pas de modèle de régression, y
c'est votre variable dépendante.