Je ne dirais pas qu'il y a un intérêt ou un débat croissant sur l'utilisation des camemberts. On les trouve juste partout sur le web et dans les solutions dites «d'analyse prédictive».
Je suppose que vous connaissez le travail de Tufte (il a également discuté de l'utilisation de plusieurs graphiques circulaires ), mais le plus drôle est le fait que le deuxième chapitre de la grammaire de Wilkinson commence par "Comment créer un graphique à secteurs?". Vous savez probablement aussi que le diagramme à points de Cleveland , ou même un diagramme à barres, transmettra des informations beaucoup plus précises. Le problème semble vraiment provenir de la façon dont notre système visuel est capable de traiter l'information spatiale. Il est même cité dans le logiciel R; de l'aide en ligne pour pie
,
Cleveland (1985), page 264: «Les données qui peuvent être affichées par des graphiques circulaires peuvent toujours être affichées par un graphique à points. Cela signifie que des jugements de position le long d'une échelle commune peuvent être faits à la place des jugements d'angle moins précis. »Cette déclaration est basée sur les enquêtes empiriques de Cleveland et McGill ainsi que sur les enquêtes de psychologues perceptifs.
Cleveland, WS (1985) Les éléments des données graphiques . Wadsworth: Monterey, Californie, États-Unis.
Il existe des variantes de graphiques circulaires (par exemple, des graphiques en forme de beignets) qui posent tous les mêmes problèmes: nous ne sommes pas bons pour évaluer l'angle et la surface. Même ceux utilisés dans "corrgram", comme décrit dans Friendly, Corrgrams: Affichages exploratoires pour les matrices de corrélation , American Statistician (2002) 56: 316, sont difficiles à lire, à mon humble avis .
À un certain moment, cependant, je me suis demandé si elles pouvaient encore être utiles, par exemple (1) afficher deux classes est bien, mais l'augmentation du nombre de catégories aggrave généralement la lecture (en particulier avec un fort déséquilibre entre%), (2) les jugements relatifs sont mieux que les valeurs absolues, c'est-à-dire que l'affichage de deux graphiques à secteurs côte à côte devrait favoriser une meilleure appréciation des résultats qu'une simple estimation à partir, par exemple, d'un graphique à secteurs mélangeant tous les résultats (par exemple, un tableau de classification croisée bidirectionnelle). Par ailleurs, j'ai posé une question similaire à Hadley Wickham qui m'a gentiment pointé vers les articles suivants:
- Spence, I. (2005). No Humble Pie: Les origines et l'utilisation d'un tableau statistique . Journal of Educational and Behavioral Statistics , 30 (4), 353–368.
- Heer, J. et Bostock, M. (2010). Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design . CHI 2010 , 10-15 avril 2010, Atlanta, Géorgie, États-Unis.
En somme, je pense qu'ils sont juste bons pour représenter grossièrement la distribution de 2 à 3 classes (je les utilise, de temps en temps, pour montrer la distribution des hommes et des femmes dans un échantillon au-dessus d'un histogramme des âges), mais ils doivent être accompagnés de fréquences ou de comptes relatifs pour être vraiment informatifs. Un tableau ferait toujours mieux car vous pouvez ajouter des marges et aller au-delà des classifications bidirectionnelles.
Enfin, il existe des affichages alternatifs qui sont construits sur l'idée de camembert. Je peux penser au graphique carré ou gaufré , décrit par Robert Kosara dans Understanding Pie Charts .