Compréhension conceptuelle de l'erreur quadratique moyenne et de l'écart de biais moyen


13

J'aimerais acquérir une compréhension conceptuelle de l'erreur quadratique moyenne (RMSE) et de l'écart de biais moyen (MBD). Après avoir calculé ces mesures pour mes propres comparaisons de données, j'ai souvent été perplexe de constater que le RMSE est élevé (par exemple, 100 kg), tandis que le MBD est faible (par exemple, moins de 1%).

Plus précisément, je recherche une référence (non en ligne) qui répertorie et discute les mathématiques de ces mesures. Quelle est la façon normalement acceptée de calculer ces deux mesures et comment dois-je les déclarer dans un article de journal?

Il serait vraiment utile dans le contexte de cet article d'avoir un ensemble de données "jouet" qui puisse être utilisé pour décrire le calcul de ces deux mesures.

Par exemple, supposons que je doive trouver la masse (en kg) de 200 widgets produits par une chaîne de montage. J'ai également un modèle mathématique qui tentera de prédire la masse de ces widgets. Le modèle n'a pas à être empirique et il peut être basé physiquement. Je calcule le RMSE et le MBD entre les mesures réelles et le modèle, constatant que le RMSE est de 100 kg et le MBD de 1%. Qu'est-ce que cela signifie conceptuellement et comment interpréter ce résultat?

Supposons maintenant que d'après le résultat de cette expérience, je trouve que le RMSE est de 10 kg et le MBD de 80%. Qu'est-ce que cela signifie et que puis-je dire à propos de cette expérience?

Quelle est la signification de ces mesures et qu'impliquent les deux (prises ensemble)? Quelles informations supplémentaires le MBD donne-t-il lorsqu'il est considéré avec le RMSE?


2
Avez-vous parcouru notre site, Nicolas? Pensez à commencer par stats.stackexchange.com/a/17545 , puis explorez certaines des balises que j'ai ajoutées à votre question.
whuber

@whuber: Merci whuber !. J'ai parcouru le site, mais pour moi, je trouve toujours un peu difficile de comprendre ce que l'on entend vraiment dans le contexte de mes propres recherches.
Nicholas Kinar

Réponses:


21

Je pense que ces concepts sont faciles à expliquer. Je préfère donc simplement le décrire ici. Je suis sûr que de nombreux livres sur les statistiques élémentaires couvrent ce sujet, y compris mon livre "Les bases de la biostatistique pour les médecins, les infirmières et les cliniciens".

Pensez à une cible avec un œil de bœuf au milieu. L'erreur quadratique moyenne représente la distance quadratique moyenne d'une flèche sur la cible et le centre. Maintenant, si vos flèches se dispersent uniformément autour du centre, le tireur n'a pas de biais de visée et l'erreur quadratique moyenne est la même que la variance.

Mais en général, les flèches peuvent se disperser autour d'un point éloigné de la cible. La distance quadratique moyenne des flèches par rapport au centre des flèches est la variance. Ce centre pourrait être regardé comme le point de visée des tireurs. La distance entre le centre ou le point de visée de ce tireur et le centre de la cible est la valeur absolue du biais.

En pensant à un triangle rectangle où le carré de l'hypoténuse est la somme des carrés des deux côtés. Ainsi, une distance au carré de la flèche à la cible est le carré de la distance de la flèche au point de visée et le carré de la distance entre le centre de la cible et le point de visée. La moyenne de toutes ces distances carrées donne l'erreur quadratique moyenne comme la somme du biais au carré et de la variance.


Je vous remercie; c'est très apprécié. Je trouve toujours un peu difficile de comprendre quelle est la différence entre RMSE et MBD. Si je comprends bien, RMSE quantifie la proximité d'un modèle avec les données expérimentales, mais quel est le rôle du MBD? Peut-être que mon malentendu est simplement lié à la terminologie.
Nicholas Kinar

1
L'écart de biais moyen comme vous l'appelez est le terme de biais que j'ai décrit. Il mesure la distance entre le point de visée et la cible. Le biais contribue à rendre le plan inexact.
Michael R. Chernick

Merci encore, Michael. Un RMSE élevé et un MBD faible impliquent donc que c'est un bon modèle?
Nicholas Kinar

Non, un RMSE élevé et un MBD faible indiquent simplement que le modèle est mauvais en raison d'une grande variance plutôt que d'un biais important. Le RMSE est le nombre qui décide de la qualité du modèle.
Michael R. Chernick

1
@bbadyalina: ce sont des informations indépendantes, de la même manière que haut / bas et gauche / droite sont indépendantes. Votre question revient à demander "si un point est centré verticalement et loin à gauche, est-il au milieu?" , ou "Si un point est haut, mais horizontalement au centre, est-il au milieu?"
naught101

1

RMSE est un moyen de mesurer la qualité de notre modèle prédictif par rapport aux données réelles, plus le RMSE est petit, meilleur est le comportement du modèle, c'est-à-dire si nous l'avons testé sur un nouvel ensemble de données (pas sur notre ensemble d'entraînement) mais un RMSE de 0,37 sur une plage de 0 à 1, représente beaucoup d'erreurs par rapport à un RMSE de 0,01 comme meilleur modèle. BIAS sert à surestimer ou à sous-estimer.


Pourriez-vous s'il vous plaît fournir plus de détails et un exemple élaboré? L'OP cherche une explication intuitive de la signification d'un RMSE de, disons, 100, par rapport à son problème d'estimation.
Xi'an

Cela ne semble pas fournir beaucoup d'intuition. Pouvez-vous expliquer plus?
Glen_b -Reinstate Monica

0

Pour autant que je puisse comprendre, un RMSE donne une valeur plus précise de l'erreur entre le modèle et observé, cependant le BIAS, en plus de donner une valeur de l'erreur (moins précise que le RMSE), il peut également déterminer si le modèle est biais positif ou biais négatif, si le modèle sous-estime ou surestime les valeurs observées.


Non. Vous pouvez considérer RMSE comme la "précision" d'un modèle - par exemple, la quantité de propagation existant dans les erreurs de ses prédictions (note: la précision est l'inverse de la variance - variance élevée = faible précision). Et vous pouvez considérer le biais comme l'erreur systématique dans le modèle - par exemple la valeur moyenne de toutes les erreurs. La «précision» du travail est une vague combinaison des deux, ce qui cause beaucoup de confusion.
naught101
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.