À quoi sert l'erreur standard?


9

J'utilise un didacticiel que j'ai trouvé et je trace des valeurs moyennes avec les erreurs standard pour afficher mes données. Mais j'ai du mal à discuter des résultats. Mon tracé est comme indiqué ci-dessous: certaines des erreurs standard (affichées sous forme de barre d'erreur) varient beaucoup et certaines sont très proches de zéro.

entrez la description de l'image ici


2
Un problème secondaire ici est que l'utilisation de barres risque de prêter à confusion. Trivialement, les barres vers le bas sont un peu plus difficiles que les barres vers le haut. Plus fondamentalement, les barres commençant à 1e-3 sont arbitraires. Plus positivement, afficher des estimations ponctuelles par des symboles ponctuels et ajouter des barres d'erreur serait beaucoup plus simple que d'afficher des barres plus des barres d'erreur. Google "dynamite plot" pour en savoir plus.
Nick Cox

Je ne sais pas quelle est la question. Sur la base de la réponse que vous avez marquée correcte et du titre, il pourrait être juste de savoir ce qu'est une erreur standard. Mais d'après ce que vous avez ici, il semble que vous ayez besoin d'aide pour décrire les données. Pourriez-vous clarifier la question? De plus, si vous voulez de l'aide pour décrire les données, veuillez en rapporter davantage sur les données, pas seulement sur la figure. Les N de chaque groupe et la signification des valeurs seraient utiles. Toute transformation effectuée serait également utile.
John

Réponses:


10

Les barres d'erreur en général doivent convaincre le lecteur de l'intrigue que les différences qu'il / elle voit sur l'intrigue sont statistiquement significatives. Dans une approximation, vous pouvez imaginer un petit gaussien dont la est représentée comme cette barre d'erreur - "l'intégration visuelle" d'un produit de deux de ces gaussiens est plus ou moins une chance que les deux valeurs soient vraiment égales.±1σ

Dans ce cas particulier, on peut voir que la différence entre les barres rouge et violette ainsi que les barres grises et vertes n'est pas trop importante.


qu'en est-il de l'erreur standard dans ce cas? sous forme de barres d'erreur tracées.
berkay

C'est une mauvaise barre d'erreur si c'est le but. Le non-chevauchement des barres n'est pas suffisant pour une signification statistique et la quantité de non-chevauchement nécessaire pour être significativement différente à 0,05 varie avec N. Et que diable signifie "pas trop significatif"? Ces deux conditions marginales que vous signalez échoueraient à un test t.
John

@John Comme je l'ai écrit, les barres d'erreur sont un indice visuel pour aider à faire des évaluations ad hoc lors de l'enquête sur l'intrigue; le test réel a besoin d'une hypothèse pour être testé, donc devrait évidemment se produire dans le texte.

11

En général, l'erreur standard vous indique à quel point vous êtes incertain que la vraie valeur du haut de la barre est où la barre indique qu'elle est. Lorsqu'il y a plusieurs barres, il peut également permettre des comparaisons entre barres, au sens d'un test statistique. Cependant, leur interprétation de cette manière nécessite certaines hypothèses, illustrées graphiquement ci-dessous. Si vous êtes vraiment intéressé à comparer les barres pour voir si les différences sont statistiquement significatives, vous devez exécuter des tests sur les données et afficher les tests significatifs, comme celui-ci.

comparaison de l'importance

De plus, je suggère d'utiliser des intervalles de confiance plutôt que des erreurs standard.

Ce document vaut la peine d'être lu:

Cumming et Finch. "Inférence par l'oeil: intervalles de confiance et comment lire des images de données." Suis Psych. Vol. 60, n ° 2, 170-180.

Leur conclusion générale est: «Cherchez des barres qui se rapportent directement aux effets d'intérêt, soyez sensibles à la conception expérimentale et interprétez les intervalles.

Pour les échantillons indépendants, en utilisant des intervalles de confiance, un demi-chevauchement des IC signifie que la différence est statistiquement significative.

bars indépendants

Pour les échantillons indépendants utilisant des barres d'erreur standard à la place, le graphique suivant vous montre comment comprendre la signification statistique:

bars indépendants, SE


Ce n'est pas vraiment une réponse (encore). Pourriez-vous augmenter cette citation avec quelques informations sur la façon dont elle aide à répondre à la question du PO? (btw, je ne suis pas le downvoter)
gung - Reinstate Monica

1
@gung Real life est intervenu alors j'ai posté une réponse partielle. Mise à jour.
Ari B. Friedman

6

Comme le dit mbq, les barres d'erreur sont un moyen de permettre à vos lecteurs de se faire une idée si les différences entre deux groupes sont significatives - c'est-à-dire si la variation au sein de chacun de vos groupes est suffisamment petite pour croire que la différence que vous avez trouvée pour la moyenne entre vos groupes.

Toutes choses étant égales par ailleurs, des barres d'erreur plus grandes signifient plus de différence au sein du groupe, mais il semble que l'axe des y de votre tracé soit transformé en log, donc les groupes inférieurs ne sont pas tout à fait à la même échelle que les plus élevés.

Vous devez être conscient, beaucoup de vos lecteurs ne comprendront pas ce que représentent les barres d'erreur, même si vous l'expliquez explicitement! Souvent, vous pouvez atteindre le même objectif avec un tracé à points instable ou un boxplot (ou les deux ensemble) pour obtenir le même effet.


en ce qui concerne l'article que vous avez mentionné, c'est une observation intéressante, mais cela ne m'étonne pas. Je trouve qu'une partie importante des concepts statistiques et des pratiques courantes est déroutante et compliquée (même si j'ai une solide formation en mathématiques et que j'ai suivi un certain nombre de cours en statistique mathématique). Personnellement, je pense que beaucoup de concepts auraient été beaucoup plus faciles à comprendre s'ils avaient été enseignés visuellement et à l'aide d'exemples, au lieu d'explications verbales longues et compliquées.
posdef

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.