J'ai un ensemble de données de séries chronologiques multivariées comprenant des variables biologiques et environnementales en interaction (plus éventuellement des variables exogènes). Outre la saisonnalité, il n'y a pas de tendance claire à long terme dans les données. Mon but est de voir quelles variables sont liées les unes aux autres. La prévision n'est pas vraiment recherchée.
Étant nouveau dans l'analyse de séries chronologiques, j'ai lu plusieurs références. Pour autant que je sache, le modèle vectoriel autorégressif (VAR) serait approprié, mais je ne me sens pas à l'aise avec la saisonnalité et la plupart des exemples que j'ai trouvés concernaient le domaine économique (comme souvent avec l'analyse de séries chronologiques…) sans saisonnalité.
Que dois-je faire avec mes données saisonnières? Je considérais les désaisonnalisation - par exemple dans R, j'utiliser decompose
et ensuite utiliser les $trend + $rand
valeurs pour obtenir un signal qui apparaît assez stationnaire (comme jugé par acf
). Les résultats du modèle VAR me prêtent à confusion (un modèle à 1 décalage est sélectionné alors que j'en aurais attendu intuitivement plus, et seuls les coefficients d'autorégression - et non de régression avec d'autres variables retardées - sont significatifs). Suis-je en train de faire quelque chose de mal, ou devrais-je conclure que mes variables ne sont pas (linéairement) liées / mon modèle n'est pas le bon (question subsidiaire: existe-t-il un équivalent non linéaire de VAR?).
[Alternativement, j'ai lu que je pourrais probablement utiliser des variables saisonnières factices, bien que je ne puisse pas comprendre exactement comment l'implémenter].
Des suggestions étape par étape seraient très appréciées, car les détails pour les utilisateurs expérimentés pourraient en fait m'informer (et les extraits de code R ou les liens vers des exemples concrets sont les bienvenus, bien sûr).