Pour décider de la mesure d'erreur de prévision ponctuelle à utiliser, nous devons prendre du recul. Notez que nous ne connaissons pas parfaitement les résultats futurs, et nous ne le saurons jamais. Le résultat futur suit donc une distribution de probabilité . Certaines méthodes de prévision produisent explicitement une telle distribution complète, et d'autres non - mais elle est toujours là, ne serait-ce qu'implicitement.
Maintenant, nous voulons avoir une bonne mesure d'erreur pour une prévision ponctuelle . Une telle prévision ponctuelle Ft est notre tentative de résumer ce que nous savons de la distribution future (c'est-à-dire la distribution prédictive) au temps t utilisant un seul nombre, une fonction dite de la densité future. La mesure d'erreur est alors un moyen d'évaluer la qualité de ce résumé de numéro unique.
Vous devez donc choisir une mesure d'erreur qui récompense les «bons» résumés numériques des densités futures (inconnues, peut-être prévues, mais peut-être seulement implicites).
Le défi est que différentes mesures d'erreur sont minimisées par différentes fonctions. Le MSE attendu est minimisé par la valeur attendue de la distribution future. Le MAD attendu est minimisé par la médiane de la distribution future. Ainsi, si vous calibrez vos prévisions pour minimiser le MAE, votre prévision ponctuelle sera la future médiane, pas la valeur attendue future, et vos prévisions seront biaisées si votre distribution future n'est pas symétrique.
Ceci est particulièrement pertinent pour les données de comptage, qui sont généralement asymétriques. Dans les cas extrêmes (disons, les ventes de Poisson distribuées avec une moyenne inférieure à Journal2 ≈ 0,69 ), votre MAE sera le plus bas pour une prévision de zéro plat. Voir ici ou ici ou ici pour plus de détails.
Je donne plus d'informations et une illustration dans Quelles sont les lacunes de l'erreur en pourcentage absolu moyen (MAPE)? Ce thread considère le mape , mais aussi d'autres mesures d'erreur, et il contient des liens vers d'autres threads liés.
En fin de compte, la mesure d'erreur à utiliser dépend vraiment de votre coût d'erreur de prévision, c'est-à-dire du type d'erreur le plus douloureux. Sans examiner les implications réelles des erreurs de prévision, toute discussion sur les «meilleurs critères» est essentiellement dénuée de sens.
Les mesures de l'exactitude des prévisions étaient un sujet important dans la communauté des prévisions il y a quelques années, et elles apparaissent toujours de temps en temps. Un très bon article à consulter est Hyndman & Koehler "Un autre regard sur les mesures de l'exactitude des prévisions" (2006).
Enfin, une alternative consiste à calculer les densités prédictives complètes et à les évaluer à l'aide de règles de notation appropriées .