Problèmes avec les camemberts

28

Il semble y avoir une discussion croissante sur les camemberts.

Les principaux arguments contre cela semblent être:

La zone est perçue avec moins de puissance que la longueur.
Les graphiques circulaires ont un rapport point-à-pixel de données très faible

Cependant, je pense qu'ils peuvent être d'une certaine manière utiles lors de la représentation des proportions. J'accepte d'utiliser un tableau dans la plupart des cas, mais lorsque vous rédigez un rapport d'activité et que vous venez d'inclure des centaines de tableaux, pourquoi ne pas avoir un graphique circulaire?

Je suis curieux de savoir ce que la communauté pense de ce sujet. D'autres références sont les bienvenues.

J'inclus quelques liens:

Afin de conclure cette question, j'ai décidé de construire un exemple de camembert vs gaufre.

entrez la description de l'image ici

data-visualization many-categories pie-chart

— deps_stats
source

7

Je trouve que votre tableau de gaufres n'est pas clair, en raison de l'espace blanc excessif.

— sesqu

3

Pourquoi MAR a-t-il 5 carrés et 7%, mais OTHER a 7 carrés et 5%?

— gerrit

1

Les deux liens sont maintenant morts

— tdc

De plus, je pense que les catégories sur le graphique gaufré doivent être lues de gauche à droite, puis de haut en bas (donc FAN devrait parcourir les 3,5 premières lignes, plutôt que les 3,5 premières colonnes). Nous lisons de gauche à droite et comparer les proportions verticalement est plus difficile que nécessaire.

— Twitch_City

24

Je ne dirais pas qu'il y a un intérêt ou un débat croissant sur l'utilisation des camemberts. On les trouve juste partout sur le web et dans les solutions dites «d'analyse prédictive».

Je suppose que vous connaissez le travail de Tufte (il a également discuté de l'utilisation de plusieurs graphiques circulaires ), mais le plus drôle est le fait que le deuxième chapitre de la grammaire de Wilkinson commence par "Comment créer un graphique à secteurs?". Vous savez probablement aussi que le diagramme à points de Cleveland , ou même un diagramme à barres, transmettra des informations beaucoup plus précises. Le problème semble vraiment provenir de la façon dont notre système visuel est capable de traiter l'information spatiale. Il est même cité dans le logiciel R; de l'aide en ligne pour pie,

Cleveland (1985), page 264: «Les données qui peuvent être affichées par des graphiques circulaires peuvent toujours être affichées par un graphique à points. Cela signifie que des jugements de position le long d'une échelle commune peuvent être faits à la place des jugements d'angle moins précis. »Cette déclaration est basée sur les enquêtes empiriques de Cleveland et McGill ainsi que sur les enquêtes de psychologues perceptifs.

Cleveland, WS (1985) Les éléments des données graphiques . Wadsworth: Monterey, Californie, États-Unis.

Il existe des variantes de graphiques circulaires (par exemple, des graphiques en forme de beignets) qui posent tous les mêmes problèmes: nous ne sommes pas bons pour évaluer l'angle et la surface. Même ceux utilisés dans "corrgram", comme décrit dans Friendly, Corrgrams: Affichages exploratoires pour les matrices de corrélation , American Statistician (2002) 56: 316, sont difficiles à lire, à mon humble avis .

À un certain moment, cependant, je me suis demandé si elles pouvaient encore être utiles, par exemple (1) afficher deux classes est bien, mais l'augmentation du nombre de catégories aggrave généralement la lecture (en particulier avec un fort déséquilibre entre%), (2) les jugements relatifs sont mieux que les valeurs absolues, c'est-à-dire que l'affichage de deux graphiques à secteurs côte à côte devrait favoriser une meilleure appréciation des résultats qu'une simple estimation à partir, par exemple, d'un graphique à secteurs mélangeant tous les résultats (par exemple, un tableau de classification croisée bidirectionnelle). Par ailleurs, j'ai posé une question similaire à Hadley Wickham qui m'a gentiment pointé vers les articles suivants:

Spence, I. (2005). No Humble Pie: Les origines et l'utilisation d'un tableau statistique . Journal of Educational and Behavioral Statistics , 30 (4), 353–368.
Heer, J. et Bostock, M. (2010). Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design . CHI 2010 , 10-15 avril 2010, Atlanta, Géorgie, États-Unis.

En somme, je pense qu'ils sont juste bons pour représenter grossièrement la distribution de 2 à 3 classes (je les utilise, de temps en temps, pour montrer la distribution des hommes et des femmes dans un échantillon au-dessus d'un histogramme des âges), mais ils doivent être accompagnés de fréquences ou de comptes relatifs pour être vraiment informatifs. Un tableau ferait toujours mieux car vous pouvez ajouter des marges et aller au-delà des classifications bidirectionnelles.

Enfin, il existe des affichages alternatifs qui sont construits sur l'idée de camembert. Je peux penser au graphique carré ou gaufré , décrit par Robert Kosara dans Understanding Pie Charts .

— chl
source

Connaissez-vous un logiciel qui implémente des cartes gaufrées?

— deps_stats

1

@deps_stats Non. Si vous souhaitez l'implémenter dans R, vous trouverez peut-être des idées dans la carte thermique du calendrier .

— chl

Il y a maintenant github.com/hrbrmstr/waffle .

— user5748

26

Mon problème personnel avec les camemberts est qu'ils peuvent être utiles pour montrer des différences comme celle-ci:

entrez la description de l'image ici

trop de gens l'utilisent pour montrer que: entrez la description de l'image ici

— utilisateur88
source

16

Les camemberts, comme le camembert, peuvent être délicieux, mais ils ne sont pas nutritifs.

En plus des remarques déjà faites, l'une est que la rotation d'un graphique à secteurs change la perception de la taille des angles, tout comme le changement de couleur.

Si un graphique à secteurs ne comporte que quelques catégories, créez un tableau. S'il a BEAUCOUP de catégories, alors les tranches seront trop fines pour être vues (et encore moins pour étiqueter avec précision).

J'ai écrit à ce sujet sur mon blog

— Peter Flom - Réintégrer Monica
source

1

(+1) Votre blog contient d'excellents exemples de dotplot vs pie-chart

— deps_stats

1

Je pense que vous avez répondu à votre propre question pour le 2e point. Si vous souhaitez acquérir un bien immobilier précieux, tant pis! Cependant, la première puce est plus importante. Avec un graphique à barres, l'observateur doit estimer la proportion relative sur la base d'un seul axe. Avec un camembert jugeant le long d'au moins 2 axes sont impliqués. Et un axe est courbé. Je pense que les camemberts sont utilisés plus efficacement lorsque vous avez plusieurs catégories dans le camembert, avec une légende, et il n'est pas si important de juger de la proportion.

— Ralph Winters
source

Mais n'est-il pas plus naturel d'utiliser un graphique à secteurs pour représenter la part de marché plutôt qu'un graphique à barres? Malgré que la zone soit perçue avec moins de puissance ...

— deps_stats

2

@deps Vous avez raison, mais il semble probable que les gens comparent des angles, et non des zones, dans des graphiques circulaires et quasi circulaires, de sorte que la situation n'est pas aussi mauvaise qu'avec la perception des zones. Les graphiques à secteurs et les «filateurs» se sont révélés être de bons moyens d'aider les gens à réfléchir correctement aux probabilités et aux proportions, de sorte qu'il y a un certain mérite à utiliser les graphiques à secteurs. (Voir Prise de décision d'un point de vue cognitif (Busemeyer et al), p. 307)

— whuber

@whuber (+1) C'est bien que vous ayez mentionné la distinction entre l'angle et l'aire (je n'ai pas remarqué votre commentaire pendant que j'écrivais ma réponse).

— chl

1

@deps_stats - Oui, il est généralement utilisé pour la part de marché. Mais d'après ce que vous savez déjà, ne pensez-vous pas qu'il est plus facile de manipuler l'affichage à vos propres goûts avec un graphique à secteurs?

— Ralph Winters

Je pense que mon problème était davantage lié au "bon goût" ou à la "conception de page", c'est-à-dire comment créer un rapport visuellement attrayant sans sacrifier la clarté? J'ai besoin d'ajouter beaucoup de tableaux et de graphiques à un client, et je suis confronté à la décision d'utiliser des graphiques pour ceci et des tableaux pour cela, trop de tableaux ou trop de graphiques. Ce dont j'ai vraiment besoin, c'est d'un équilibre entre l'attrait visuel et une bonne représentation des données. Les gaufriers semblent être une alternative très intéressante aux camemberts!

— deps_stats

1

Je ne peux penser à presque aucun cas dans lequel un graphique à secteurs est meilleur qu'un graphique à barres ou une barre empilée si vous souhaitez transmettre des informations.

J'ai une théorie ou deux sur la façon dont les camemberts sont devenus si populaires. Ma première pensée est liée aux publicités PC. Les premiers PC avaient des écrans de texte (24 x 80 caractères), souvent verts comme les anciens CRT de l'ordinateur central. Pour montrer les nouveaux écrans graphiques qui avaient une base de pixels rouge-vert-bleu, un graphique à secteurs était idéal. Un écran de texte pourrait faire un graphique à barres à la mode, mais ne pourrait pas faire un graphique à secteurs crédible à distance. Les camemberts semblaient beaucoup plus sérieux que de montrer un écran Mario Brothers, quelle que soit la façon dont le PC serait réellement utilisé. Ainsi, il semblait que chaque publicité pour PC à la fin des années 80 et au début des années 90 montrait un graphique à secteurs sur le moniteur.

Une deuxième théorie est qu'un graphique à barres ou une barre empilée est préférable si vous souhaitez transmettre des informations. Et si vous ne le faites pas? Ensuite, un graphique à secteurs fonctionne - et les graphiques avec des effets 3D fonctionnent encore mieux.

— zbicycliste
source

1

Votre gaufre a besoin que les valeurs rouges et bleues soient commutées. Quant à la question de la tarte contre la gaufre, je me penche vers la gaufre. Avec les gaufriers, vous pouvez toujours transmettre les informations à de petites tailles, même si les blocs se mélangent, la couleur représente toujours les régions.

— Grafic_UT
source