Erreur à signaler avec des représentations médianes et graphiques?


11

J'ai utilisé un large éventail de tests pour mes données de thèse, des ANOVA paramétriques et des tests t aux tests Kruskal-Wallis non paramétriques et Mann-Whitneys, ainsi que des ANOVA bidirectionnelles transformées par rang et des GzLM avec binaire, poisson et données proportionnelles. Maintenant, je dois tout rapporter pendant que j'écris tout cela dans mes résultats.

J'ai déjà demandé ici comment signaler les intervalles de confiance asymétriques pour les données de proportion. Je sais que l'écart type, l'erreur standard ou les intervalles de confiance sont appropriés pour les moyennes, ce que je signalerais si tous mes tests étaient bien paramétriques. Cependant, pour mes tests non paramétriques, dois-je déclarer des médianes et non des moyens? Si oui, quelle erreur est-ce que je signalerais avec cela?

Ceci est associé à la meilleure façon de présenter graphiquement les résultats des tests non paramétriques. Étant donné que j'ai en grande partie des données continues ou d'intervalle dans les catégories, j'utilise généralement des graphiques à barres, le haut de la barre étant la moyenne et les barres d'erreur montrant un IC à 95%. Pour les tests NP, puis-je toujours utiliser des graphiques à barres, mais le haut de la barre représente-t-il la médiane?

Merci pour vos suggestions!


Quelque chose ne calcule pas. Comment pouvez-vous avoir des moyens ou des médianes ou des IC avec des données catégoriques?
rolando2

Désolé, ce n'était pas clair @ rolando2 ... J'ai des catégories dans lesquelles j'ai des données continues ou d'intervalle (la question d'origine a été modifiée pour clarifier maintenant).
Mog

Réponses:


6

Vous pouvez signaler un intervalle de confiance pour la médiane. Dans R, vous pouvez utiliser wilcox.testavec l'argument conf.int=TRUE. Il y a une petite discussion de cela dans John Verzani de simples notes : voir ici .

En ce qui concerne les graphiques: je n'aime pas vraiment utiliser les graphiques à barres, même pour représenter un ensemble de moyens. Je préfère simplement tracer de petits segments de ligne pour le CI: tracé des barres amélioré

L'intrigue de droite a été réalisée à errbar()partir du package Hmisc [ page CRAN ].

Vous pouvez faire le même type de graphique pour les médianes et les intervalles de confiance associés, ou vous pouvez utiliser des graphiques en boîte (qui, dans la même quantité d'espace, décrivent la distribution entière).


Merci pour les conseils Karl! Y a-t-il une raison particulière pour laquelle vous n'aimez pas les bars, ou s'agit-il d'une préférence personnelle?
Mog

1
@Mog: Les barres semblent un gaspillage d'encre / d'espace; ils vous obligent à inclure 0 sur l'axe des y, ce qui n'est souvent pas nécessaire; et ils vous empêchent de montrer les moitiés inférieures des intervalles. Les barres pourraient être aggravées (par exemple avec la 3D gratuite). Avec de petits ensembles de données, je préfère afficher les points de données réels.
Karl
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.