J'ai un énorme problème avec un problème conceptuel que j'ai trouvé.
Disons qu'une entreprise a une distribution très asymétrique. Quelque chose de similaire à une exponentielle ou log-normale, mais plus extrême. Imaginez maintenant que la distribution est si asymétrique que la moyenne de la distribution est supérieure au 99% de centile de la distribution. (Aka 1-2 valeurs extrêmement élevées ont fait que la moyenne était extrêmement élevée par rapport au reste de la distribution).
Par définition, si cette distribution était utilisée pour prévoir une valeur future (c'est-à-dire un échantillon aléatoire de la distribution), serait-il vrai que la moyenne ne serait pas dans l'intervalle de prédiction à 95%?
Dans mon cerveau, un intervalle de prédiction de 95% est une plage entre laquelle 95% de toutes les valeurs futures se situeront. Pour toute distribution, cela devrait correspondre exactement au percentile 0,025 sur la borne inférieure et au percentile 0,975 sur la borne supérieure ... Si la moyenne est supérieure au percentile 0,975, alors la moyenne ne se situerait pas dans les '95% intervalle de prédiction ».
Est-ce que je pense mal à cela? Il semble étrange de rapporter une prévision
- Valeur moyenne prévue: 6 000 0000
- Intervalle de prédiction à 95%: [400 500].