Tracer des résultats n'ayant que la moyenne et l'écart-type


11

J'essaie de visualiser un graphique approprié pour les observations dans ce tableau des moyennes et des écarts-types des scores de rappel:

ControlExperimentalMeanSDMeanSDRecall378216

Quelle est la meilleure façon de procéder? Le graphique à barres est-il un bon moyen de le faire? Comment puis-je illustrer l'écart type dans ce cas?


11
Si vous n'avez pas plus de données, je ne créerais pas de graphique. Ce serait une perte d'espace.
Roland

4
Si vous n'en avez pas plus, une analyse complète est difficile, car ces moyens et SD sont compatibles avec de nombreuses distributions différentes.
Nick Cox

Réponses:


9

L'écart type sur les graphiques à barres peut être illustré en y incluant des barres d'erreur .

La visualisation ( source ) ci-dessous est un exemple d'une telle visualisation:

entrez la description de l'image ici


D'après une discussion dans les commentaires ci-dessous, avoir uniquement les moustaches d'erreur au lieu de la configuration des barres d'erreur semble une meilleure façon de visualiser ces données. Ainsi, le graphique peut ressembler à ceci:

entrez la description de l'image ici


4
Le principe va clairement dans le bon sens, mais je suggérerais des améliorations à votre graphique. Si les bacs sont destinés à toucher les intervalles, les barres doivent également se toucher et indiquer les limites du bac à lui seul suffit. Indépendamment de cela, le hachurage croisé est, à mon avis, juste une distraction ici. BTW, comment dénoteriez-vous une erreur pour un comptage observé nul?
Nick Cox

2
Au moins cet exemple a les barres d'erreur des deux côtés, les pires " parcelles de dynamite " n'en ont même pas, voir ici pour un exemple.
Andy W

1
Non! Je voulais dire tracer des moustaches d'erreur sans tracer les barres. Les bars sont mauvais.
amibe dit Réintégrer Monica

3
Je pense que les barres peuvent convenir pour les petits comptes, comme dans cet exemple, et pour certaines autres quantités mesurées également avec origine naturelle et niveau de référence zéro, tant qu'elles n'obstruent pas les barres d'erreur. Mais les barres peuvent être stupides et distrayantes (plutôt que mauvaises) quand ce n'est pas un problème que les valeurs soient ou non nulles.
Nick Cox

2
Une autre possibilité est un tracé de points Cleveland ( pdf ), qui est essentiellement le même que votre version dot & whisker, sauf qu'ils vont horizontalement. Les barres d'erreur sont moins courantes sur les tracés de points, mais sont certainement acceptables.
gung - Rétablir Monica

8

Je suggère un tracé de points:

Bien qu'il y ait encore une marge d'amélioration (peut-être en atténuant les bords du grand rectangle entourant les données), presque toute l'encre est utilisée pour afficher les informations.


1
Comment cela répond-il à la question du PO? Comment utilisez-vous dotplot avec les moyennes et les écarts-types?
kjetil b halvorsen

1
Cette page Stack Overflow explique comment générer des points à partir de moyennes et de SD.
EdM

3
@kjetilbhavlorsen: La moyenne est le point, et l'écart-type (ou éventuellement l'erreur standard de la moyenne) est affiché en utilisant la longueur des lignes adjacentes au point.

3
(+1) Le terme "point plot" est plutôt surchargé, ma première pensée était que vous alliez suggérer de dessiner des points pour chaque point de données (ce que bien sûr l'OP ne peut pas faire, n'ayant pas les données brutes). Je soupçonne que c'est aussi ce que @kjetil s'est demandé. Cette variété de "point plot" a-t-elle un nom plus spécifique qui le distingue du type de point "dot for each point de données"?
Silverfish

0

Peut-être que la meilleure façon de visualiser le type de données qui donne lieu à ce genre de résultats est de simuler un ensemble de données de quelques centaines ou quelques milliers de points de données où une variable (contrôle) a une moyenne de 37 et un écart-type 8 tandis que l'autre (expérimental) a 21 hommes et l'écart-type 6. La simulation est assez simple dans une feuille de calcul ou votre package de statistiques préféré. Vous pouvez ensuite représenter graphiquement les deux distributions pour avoir une idée de la mesure dans laquelle les deux ensembles de scores de rappel varient.

graphique Excel simple

Avec un ensemble de données simulé, vous pouvez également facilement créer des graphiques récapitulatifs comme des boîtes à moustaches ou des histogrammes avec des barres d'erreur.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.