J'ai récemment découvert un article fascinant sur la prévision des rendements futurs du marché boursier. L'auteur présente le graphique ci-dessous et cite un R ^ 2 de 0,913. Cela rendrait la méthode de l'auteur bien supérieure à tout ce que j'ai jamais vu sur le sujet (la plupart soutiennent que le marché boursier est imprévisible).
L'auteur décrit sa méthode en détail et fournit une théorie substantielle pour étayer les résultats. J'ai ensuite lu un deuxième article critique critiquant cet article: Le mythe de la prévisibilité à long terme . Apparemment, les gens tombent amoureux de cette illusion depuis des décennies. Malheureusement, je ne comprends pas vraiment le document.
Cela m'amène aux questions suivantes:
- La fausse confiance des prévisions à long terme est-elle due à l'utilisation du même ensemble de données pour la formation et la validation du modèle? Le problème disparaîtrait-il si les données de formation et de validation étaient extraites de périodes distinctes qui ne se chevauchent pas?
- En plus de valider sur l'ensemble de formation, pourquoi ce problème devient-il plus prononcé sur des horizons plus longs?
- En général, comment puis-je surmonter ce problème lors de la formation de modèles qui doivent faire des prédictions à long terme?