La façon la plus simple de répondre à votre question est de comprendre qu'en gros, les ensembles de données sont souvent classés comme transversaux , séries chronologiques et panel . La régression transversale est un outil de référence pour les ensembles de données transversales. C'est ce que la plupart des gens savent et se réfèrent à un terme de régression . La régression des séries chronologiques est parfois appliquée aux séries chronologiques, mais l'analyse des séries chronologiques dispose d'un large éventail d'outils au-delà de la régression.
Un exemple de données transversales est , où sont les poids et les hauteurs des élèves choisis au hasard dans une école. Lorsqu'un échantillon est aléatoire, nous pouvons souvent exécuter une régression linéaire et obtenir des résultats fiables, pour peut-être prédire la taille d'un élève de cette école connaissant uniquement le poids de l'élève .(x1,y1),(x2,y3),…,(xn,yn)xi,yiy∼xy^x
Si l'échantillon n'était pas aléatoire, la régression peut ne pas fonctionner du tout. Par exemple, vous n'avez choisi que des filles en première année pour estimer le modèle, mais vous devez prédire la taille d'un élève de 12e année. Ainsi, la régression a ses propres problèmes, même dans la configuration transversale.
Maintenant, regardez les données de séries chronologiques, il peut s'agir de tels que , où le mois d'une année et sont toujours le poids et la taille mais d'un élève particulier dans cette école.xt,yt(x1,y1),(x2,y3),…,(xn,yn)tx,y
En règle générale, la régression n'a pas du tout à fonctionner. Une des raisons est que les indices sont ordonnés. Votre échantillon n'est donc pas aléatoire, et j'ai mentionné plus tôt que la régression préfère qu'un échantillon aléatoire fonctionne correctement. C'est un problème sérieux. Les données de séries chronologiques ont tendance à être persistantes, par exemple votre taille ce mois-ci est fortement corrélée à votre taille le mois prochain. Afin de traiter ces questions, l'analyse des séries chronologiques a été développée, elle incluait également la technique de régression, mais elle doit être utilisée de certaines manières.t
Le troisième type d'ensembles de données commun est un panneau, en particulier, les seules données longitudinales. Ici, vous pouvez obtenir plusieurs instantanés des variables de poids et de taille pour un certain nombre d'élèves. Cet ensemble de données peut ressembler à des vagues de coupes transversales ou à un ensemble de séries chronologiques.
Naturellement, cela peut être plus compliqué que les deux types précédents. Ici, nous utilisons la régression des panneaux et d'autres techniques spéciales développées pour les panneaux.
En résumé, la raison pour laquelle la régression des séries chronologiques est considérée comme un outil distinct par rapport à la régression transversale est que les séries chronologiques présentent des défis uniques en ce qui concerne les hypothèses d'indépendance de la technique de régression. En particulier, du fait que, contrairement à l'analyse transversale, l'ordre des observations est important, il conduit généralement à toutes sortes de structures de corrélation et de dépendance, ce qui peut parfois invalider l'application des techniques de régression. Vous devez gérer la dépendance, et c'est exactement ce à quoi l'analyse des séries chronologiques est bonne.
Prévisibilité des prix des actifs
En outre, vous répétez une idée fausse commune sur les marchés boursiers et les prix des actifs en général, selon laquelle ils ne peuvent pas être prédits. Cette affirmation est trop générale pour être vraie. Il est vrai que vous ne pouvez pas prédire de manière fiable la prochaine tic d'AAPL. Cependant, c'est un problème très étroit. Si vous élargissez votre réseau, vous découvrirez de nombreuses opportunités de gagner de l'argent en utilisant toutes sortes de prévisions (et l'analyse de séries chronologiques en particulier). L'arbitrage statistique est l'un de ces domaines.
Maintenant, la raison pour laquelle les prix des actifs sont difficiles à prévoir à court terme est due au fait qu'une grande partie des changements de prix sont de nouvelles informations. Les informations vraiment nouvelles qui ne peuvent pas être imaginées de manière réaliste à partir du passé sont par définition impossibles à prévoir. Cependant, c'est un modèle idéalisé, et beaucoup de gens diraient qu'il existe des anomalies qui permettent la persistance de l'état. Cela signifie que la partie de la variation des prix peut être expliquée par le passé. Dans de tels cas, l'analyse des séries chronologiques est tout à fait appropriée car elle traite précisément de la persistance. Il sépare le nouveau de l'ancien, le nouveau est impossible à prévoir, mais l'ancien est tiré du passé vers le futur. Si vous pouvez expliquer un petit peu, en finance, cela signifie que vous pouvezêtre en mesure de gagner de l'argent. Tant que le prix de la stratégie fondée sur de telles prévisions couvre les revenus qu'elle génère.
Enfin, jetez un œil au prix Nobel d' économie en 2013 : "il est tout à fait possible de prévoir le cours général de ces prix sur des périodes plus longues, comme les trois à cinq prochaines années". Jetez un oeil à la conférence Nobel de Shiller , il discute de la prévisibilité des prix des actifs.