Dans le contexte des prévisions, l'élimination des valeurs aberrantes est très dangereuse. Par exemple, vous prévoyez les ventes d'une épicerie. Disons qu'il y a eu une explosion de gaz dans le bâtiment voisin, ce qui vous a obligé à fermer le magasin pendant quelques jours. Ce fut la seule fois que le magasin a fermé ses portes en 10 ans. Ainsi, vous obtenez la série chronologique, détectez la valeur aberrante, supprimez-la et prévoyez. Vous avez supposé en silence que rien de tel ne se produirait à l'avenir. En pratique, vous avez compressé votre variance observée et les variances de coefficient ont diminué. Donc, si vous montrez les bandes de confiance pour vos prévisions, elles seront plus étroites qu'elles ne l'auraient été si vous n'aviez pas supprimé la valeur aberrante.
Bien sûr, vous pouvez conserver la valeur aberrante et continuer comme d'habitude, mais ce n'est pas une bonne approche non plus. La raison en est que cette valeur aberrante faussera les coefficients.
Je pense qu'une meilleure approche dans ce cas est de permettre une distribution d'erreur avec de grosses queues, peut-être une distribution stable. Dans ce cas, votre valeur aberrante ne biaisera pas trop les coefficients. Ils seront proches des coefficients avec une valeur aberrante supprimée. Cependant, la valeur aberrante apparaîtra dans la distribution d'erreur, la variance d'erreur. Essentiellement, vous vous retrouverez avec des bandes de confiance de prévision plus larges.
Les bandes de confiance véhiculent une information très importante. Si vous prévoyez que les ventes seraient de 1000000 $ ce mois-ci, mais il y a 5% de chances qu'elles soient de 10000 $, cela a un impact sur vos décisions en matière de dépenses, de gestion de la trésorerie, etc.