"Prédiction" et "estimation" sont en effet parfois utilisés de manière interchangeable dans une écriture non technique et semblent fonctionner de la même manière, mais ils sont nettement différenciés dans le modèle standard d'un problème statistique. Un estimateur utilise des données pour deviner un paramètre, tandis qu'un prédicteur utilise ces données pour deviner une valeur aléatoire ne faisant pas partie du jeu de données. Pour ceux qui ne sont pas familiarisés avec ce que "paramètre" et "valeur aléatoire" signifient dans les statistiques, voici une explication détaillée.
Dans ce modèle standard, les données sont supposées constituer une observation (éventuellement multivariée) d'une variable aléatoire X dont on sait que la distribution se situe dans un ensemble défini de distributions possibles, les "états de la nature". Un estimateur t est une procédure mathématique qui attribue à chaque valeur possible de x une propriété t ( x ) d’état de nature θ , telle que sa moyenne µ ( θ ) . Ainsi, une estimation est une conjecture sur le véritable état de la nature. Nous pouvons dire à quel point une estimation est bonne en comparant t ( x )XX tXt ( x )θμ ( θ )t ( x )à .μ ( θ )
Un prédicteur concerne l'observation indépendante d'une autre variable aléatoire Z dont la distribution est liée au véritable état de la nature. Une prédiction est une conjecture sur une autre valeur aléatoire. Nous pouvons dire à quel point une prédiction particulière est seulement en comparant p ( x ) à la valeur réalisée par Z . Nous espérons qu’en moyenne l’accord sera bon (dans le sens d’une moyenne sur tous les résultats possibles x et simultanément sur toutes les valeurs possibles de Z ).p(x)Zp(x)Zx Z
Les moindres carrés ordinaires donnent l'exemple standard. Les données consistent en des paires associant les valeurs y i de la variable dépendante aux valeurs x i de la variable indépendante. L'état de nature est spécifié par trois paramètres α , β et σ : il est dit que chaque y i est comme un tirage indépendant d'une distribution normale avec une moyenne α + β x i et un écart type σ . α , β et(xi,yi)yixiαβσyiα+βxiσαβ sont des paramètres (nombres) supposés fixes et non variables. L'intérêt porte sur α (l'ordonnée à l'origine) et β (la pente). Les OLS estiment, écrit ( α , β ) , est bon dans le sens où α tend à être proche de a et β ont tendance à être proche de β ,peu importevaleurs que la vraie (mais inconnue) de α et β pourrait être.σαβ(α^,β^)α^αβ^βαβ
La prédiction OLS consiste à observer une nouvelle valeur de la variable dépendante associée à une valeur x de la variable indépendante. x peut être ou ne pas être parmi les x i de l'ensemble de données; c'est immatériel. Une bonne prédiction est intuitivement que cette nouvelle valeur est susceptible d'être proche de α + β x . De meilleures prévisions indiquent à quel point la nouvelle valeur peut être proche (on les appelle des intervalles de prédiction ). Ils représentent le fait que αZ=Y(x)xxxiα^+β^xα^et β sont incertaines (car ils dépendent de mathématiquement les valeurs aléatoires ( y i ) ), que σ est pas connue avec certitude (et doit donc être estimée), ainsi que l'hypothèse selon laquelle Y ( x ) a une distribution normale avec écart type σ et moyenne α + β x (notez l’absence de chapeau!).β^(yi)σY(x)σα+βx
(xi,yi)σY(x)Y(x)α^+β^x α+βxp(x)t(x)
Ici, alors, dans l'exemple de MCO, nous voyons clairement la distinction: une estimation devine les paramètres (qui sont des nombres fixes mais inconnus), tandis qu'une prédiction devine la valeur d'une quantité aléatoire. La source de confusion potentielle est que la prédiction s'appuie généralement sur les paramètres estimés et peut même avoir la même formule qu'un estimateur.
En pratique, vous pouvez distinguer les estimateurs des prédicteurs de deux manières:
but : un estimateur cherche à connaître une propriété du véritable état de nature, alors qu'une prédiction cherche à deviner le résultat d'une variable aléatoire; et
incertitude : un prédicteur a généralement une incertitude plus grande que celle d'un estimateur associé, en raison de l'incertitude supplémentaire liée au résultat de cette variable aléatoire. Par conséquent, les prédicteurs bien documentés et décrits comportent généralement des bandes d’incertitude - des intervalles de prévision - qui sont plus larges que les bandes d’incertitude des estimateurs, appelées intervalles de confiance. Une caractéristique des intervalles de prédiction est qu'ils peuvent (hypothétiquement) être réduits au fur et à mesure que le jeu de données se développe, mais ils ne seront pas réduits à une largeur nulle - l'incertitude du résultat aléatoire est "irréductible" - alors que la largeur des intervalles de confiance tend à réduire à zéro, ce qui correspond à notre intuition selon laquelle la précision d'une estimation peut devenir arbitrairement bonne avec des quantités suffisantes de données.
En appliquant ceci à l’évaluation de la perte potentielle sur un investissement, considérez d’abord le but: voulez-vous savoir combien vous pourriez perdre réellement sur cet investissement (ou sur ce panier d’investissements) au cours d’une période donnée, ou bien devinez-vous vraiment quelle est la perte attendue (sur un vaste univers d'investissements, peut-être)? Le premier est une prédiction, le dernier une estimation. Alors considérez l'incertitude. Comment votre réponse changerait-elle si vous disposiez de ressources presque infinies pour collecter des données et effectuer des analyses? Si cela devenait très précis, vous estimez probablement le retour sur investissement attendu, alors que si vous restez très incertain quant à la réponse, vous faites une prédiction.
Ainsi, si vous ne savez toujours pas à quel animal vous avez affaire, demandez ceci à votre estimateur / prédicteur: dans quelle mesure est-il faux et pourquoi? Grâce aux critères (1) et (2), vous saurez ce que vous avez.