Pratiquez beaucoup d’enseignement aux non-spécialistes sur l’écart type et la variance.
TL; DR; C'est à peu près comme la moyenne des distances par rapport à la moyenne. (ce qui est un peu déroutant et trompeur dans une telle version concise. Alors lisez l'article complet)
Je suppose qu'un profane connaît la moyenne. Je parle d’importance de connaître le DD et d’estimer les erreurs (voir PS ci-dessous). Ensuite, je vous promets qu'aucune connaissance en mathématiques élevées ou en statistiques sacrées ne sera utilisée - juste un raisonnement aride et une logique pure.
Le problème. Disons que nous avons un thermomètre (je choisis un appareil de mesure en fonction de ce qui est le plus proche de l'auditif).
Nous avons fait N mesures de la même température et le thermomètre nous a montré quelque chose comme 36,5, 35,9, 37,0, 36,6, ... (voir la photo). Nous savons que la température réelle était la même, mais le thermomètre nous repose un peu à chaque mesure.
Comment pouvons-nous estimer combien cette petite racaille nous ment?
Nous pouvons calculer la moyenne (voir la ligne rouge sur l'image ci-dessous). Pouvons-nous le croire? Même après la moyenne, a-t-il assez de précision pour nos besoins?
L'approche la plus facile . Nous pouvons prendre le point le plus éloigné, calculer la distance qui le sépare de la moyenne (ligne rouge) et dire que c’est ainsi que nous trouve le thermomètre, car c’est l’erreur maximale que nous voyons. On pourrait deviner, ce n'est pas la meilleure estimation. Si nous regardons la photo, la plupart des points se situent autour de la moyenne, comment pouvons-nous décider d'un seul point? En réalité, on peut s'exercer à la numérotation pour des raisons qui rendent cette estimation approximative et généralement mauvaise.
La variance . Ensuite ... prenons toutes les distances et calculons la distance moyenne !
(xi−x¯)x¯xi
On pourrait alors imaginer que la formule de distance moyenne résumerait tout et serait divisée par N:
∑(xi−x¯)N
Mais il y a un problème. Nous pouvons facilement voir, par exemple. que 36,4 et 36,8 sont à la même distance de 36,6. mais si nous mettons les valeurs dans la formule ci-dessus, nous obtenons -0,2 et +0,2, et leur somme est égale à 0, ce qui n'est pas ce que nous voulons.
Comment se débarrasser du signe? (À ce stade, les non-initiés disent généralement "Prendre une valeur absolue" et suggèrent que "prendre une valeur absolue est un peu artificiel, quelle est une autre manière?"). Nous pouvons concilier les valeurs! Alors la formule devient:
∑(xi−x¯)2N
Cette formule s'appelle "Variance" en statistique. Et il est beaucoup plus judicieux d'estimer l'étendue de nos valeurs de thermomètre (ou autre) que de simplement prendre la distance maximale.
Écart type . Mais il reste encore un problème. Regardez la formule de la variance. Les carrés font nos unités de mesure ... au carré. Si le thermomètre mesure la température en ° C (ou ° F), notre estimation d'erreur est mesurée en (ou ). Comment neutraliser les carrés? - Utilise la racine carrée! ° F 2°C2°F2
∑(xi−x¯)2N−−−−−−−−−−√
Nous arrivons donc à la formule de déviation standard qui est communément notée . Et c’est le meilleur moyen d’estimer la précision de nos appareils.σ
À ce stade, un profane comprend très bien comment nous arrivons ici et comment fonctionne l'écart-type / variance. À partir de ce moment, je passe généralement à la règle 68-95-99.7, décrivant également les termes concernant l’échantillonnage et la population, l’erreur type et les termes de déviation standard, etc.
PS Importance de connaître un exemple de discours sur le DD
Disons que vous avez un appareil de mesure qui coûte 1 000 000 $ . Et cela vous donne la réponse: 42. Pensez-vous qu’on a payé 1 000 000 $ pour 42? Phooey! On a payé 1000 000 pour la précision de cette réponse. Parce que Value - ne coûte rien sans connaître son erreur. Vous payez pour l'erreur, pas la valeur. Voici un bon exemple de vie.
Dans la vie courante, nous utilisons la plupart du temps une règle pour mesurer une distance. La règle vous donne une précision d'environ un millimètre (si vous n'êtes pas aux États-Unis). Et si vous deviez dépasser le millimètre et mesurer quelque chose avec une précision de 0.1mm? - Vous utiliseriez probablement un pied à coulisse. Maintenant, il est facile de vérifier qu’une règle la moins chère (mais toujours avec une précision millimétrique) coûte centimes, alors qu'un bon pied à coulisse coûte un dixième de dollar. 2 magnitudes d'un prix pour 1 magnitude de la précision. Et c'est très habituel de combien vous payez pour une erreur.