Dois-je utiliser une échelle discrète ou continue pour colorer un chloroplèthe?


8

Je fais un choroplèth pour une prochaine course locale en utilisant D3 . Deux candidats se présentent aux élections. Pour tout polygone donné sur ma carte, si le candidat rouge a plus de votes, la couleur doit être rouge. Si le candidat bleu a plus de voix, la couleur doit être bleue. Si le candidat bleu gagne beaucoup, la couleur doit être d'un bleu plus profond. Si le candidat rouge gagne beaucoup, la couleur doit être d'un rouge plus profond.

Dois-je utiliser une échelle discrète ou continue pour cela? Ce qui signifie, dois-je créer une rampe de couleur du rouge au bleu pour une saturation ou une intensité donnée. Ou dois-je créer des bacs de telle sorte que si le rouge / bleu tombe dans une certaine plage, le polygone se voit attribuer l'une des quelques couleurs? D'après les tutoriels, il semble que la plupart des gens fabriquent des bacs.


Recherchez également le sujet de la cartographie / cartes bivariées en couleur , au cas où vous souhaiteriez plus d'idées sur la technique choisie.
Martin F

Des données équilibrées (deux catégories, une augmentation dans l'une implique nécessairement une diminution dans l'autre), peuvent être conçues comme une variable unique. Étant donné que dans de nombreuses élections, la grande majorité des voix est pour deux candidats (même s'il y a plus de deux candidats dans la course), une augmentation pour l'un est une diminution pour un autre. Par conséquent, cela n'a pas vraiment besoin d'être considéré comme une carte bivariée.
Lee Hachadoorian

Réponses:


13

Il y a des avantages et des inconvénients à chaque façon de procéder. Pour faire une histoire courte, je recommanderais de créer des «bacs». Quelques notes pour vous aider à choisir et à concevoir des choroplèthes en général:

Une cartographie directe de la valeur des données en couleur (une carte `` non classée '') pourrait être considérée comme le moyen le plus précis d'afficher les données, mais les cartes classées (cartes avec `` bacs '') peuvent être plus lisibles pour plusieurs raisons.

Si vous utilisez une carte non classée et que les données sont asymétriques, ou qu'il y a des valeurs aberrantes dans l'ensemble de données, les valeurs aberrantes se démarqueront clairement, tandis que de nombreux polygones peuvent se révéler de couleur très similaire. Cela mettrait en évidence le fait que quelques domaines sont radicalement différents des autres (dans votre cas, si quelques domaines avaient une préférence significativement plus grande pour un candidat par rapport à l'autre que la plupart des domaines), mais il est plus difficile de distinguer les relations au sein de le reste de la zone de la carte.

Dans une carte classée, chaque classe doit être visuellement distincte, il est donc facile de dire où se trouve une zone dans les données, au prix de certaines des distinctions plus fines qui sont perdues.

Un autre problème est que la perception de l'intensité des couleurs n'est pas strictement linéaire. Donc, si vous aviez une rampe de couleur du blanc au bleu, correspondant à aucun candidat ne recevant plus de votes pour le plomb maximum pour un candidat, la couleur qui est à 75% entre le blanc et le bleu pourrait ne pas être perçue comme étant 75% de la entre les deux couleurs, et donc l'utilisateur de la carte ferait une fausse hypothèse sur la valeur des données qu'il représentait.

Les cartes classées, en revanche, peuvent avoir la couleur de chaque classe soigneusement choisie pour être perçue clairement et distinctement. Je n'en sais pas assez pour concevoir un ensemble de couleurs qui le fait, mais Cynthia Brewer et Mark Harrower le font, et ils ont créé colorbrewer2.org , un excellent outil (gratuit) pour aider les cartographes à choisir de bons schémas de couleurs pour leurs cartes. Vous pouvez choisir parmi une variété de schémas, choisir le nombre de classes, et cela donne un aperçu de ce à quoi le schéma pourrait ressembler dans la pratique, et les valeurs RBG, HEX ou CMJN pour chaque couleur du schéma. Très utile et simplement amusant à jouer.

Pour ces raisons, je recommanderais de faire une carte classée. Le nombre recommandé de classes est généralement un nombre impair compris entre 5 et 9. L'utilisation d'un nombre impair donne une valeur moyenne distincte, et ce nombre de classes est généralement considéré comme suffisant pour donner des distinctions utiles dans les données, mais pas trop pour devenir impossible à distinguer. Puisque vous utilisez un schéma de couleurs divergentes (couleur claire au milieu, deux couleurs différentes à chaque extrémité), vous pouvez vous en sortir avec plus de classes, peut-être 7-9.

Rendez-vous sur Colorbrewer, choisissez "divergentes" pour la nature de vos données, sélectionnez le schéma de couleurs rouge à bleu, choisissez votre nombre de classes, et c'est parti!

Pour une grande partie de cela, il n'y a pas de règle stricte. La norme est la suivante: "la carte communique-t-elle bien les données?" Jouer avec les paramètres jusqu'à ce que vous obteniez quelque chose qui "fonctionne" peut être une bonne chose.

Maintenant, une note sur la fabrication de choroplèthes. Je m'excuse si cela vous est familier:

Un point d'intérêt lors de l'utilisation d'une carte classée est la façon dont les données sont divisées en classes. Est-il cassé à intervalles égaux le long de la plage? Un certain nombre de points de données sont-ils attribués à chaque classe? Un certain nombre d'écarts-types par rapport à la moyenne? Est-il cassé lors de ruptures "naturelles" des données? La méthode que vous utilisez fait une différence dans la façon dont les données sont représentées. Je ne suis pas un grand programmeur et je ne sais pas quelle méthode le script que vous liez utilise. Les «pauses naturelles» sont généralement un bon choix. Pour les données avec un point médian clair comme les données d'interrogation (le point médian étant une répartition 50/50), les écarts-types peuvent être utiles.

Lors de la réalisation d'un choroplèthe, il est bon d'utiliser des données standardisées sur une unité de surface. Par exemple, au lieu d'utiliser la population totale d'un comté, il est préférable de cartographier la population par mile carré dans chaque comté. La raison étant qu'une zone plus grande aura tendance à contenir plus de personnes qu'une zone plus petite, donc la division par la zone de chaque unité cartographiée donne une représentation plus précise des tendances. Les données peuvent également être normalisées en pourcentage. Par exemple, un taux de pauvreté plutôt qu'un certain nombre de personnes en situation de pauvreté.

Pour vos besoins, il est plus révélateur de cartographier le pourcentage de votes exprimés pour un candidat que le nombre brut de votes exprimés pour ce candidat.

Quoi qu'il en soit, j'espère que cela est utile et que votre carte se révèle bien!

Pour une grande partie de cette discussion, je me suis inspiré de la cartographie thématique et de la géovisualisation de Slocum et al.


La couleur discrète par habitant du NYT représente une carte assez terrible de nos jours. Tant de détails sont perdus parce que leurs bacs de couleur sont idiotement énormes. Je pense que c'est définitivement un exemple où une échelle de couleurs continue devrait être utilisée.
Andy

(les cartes des coronavirus)
Andy

5

Vous abordez l'un des nombreux aspects de la symbolisation : comment représenter des valeurs quantitatives via une représentation de couleur variable - en utilisant une échelle discrète ou continue de saturation ou d'intensité de couleur. Bonne question. La réponse est, comme souvent, cela dépend ...

La cartographie thématique traditionnelle reconnaît que les cartes, en tant que modèles simplifiés de la réalité, sont le produit d'une grande généralisation. Par souci de simplicité, les quantités sont regroupées en classes (bacs) - et il y a eu de nombreuses discussions sur le nombre de ces classes (5 ou 7 ont souvent été présentées). Les avantages: beaucoup plus simple à construire en utilisant des méthodes photo-mécaniques traditionnelles, et plus facile à faire passer le message. Regardez, ici Red Ken est favorisé, tandis que là-bas, Blue Peter.

La cartographie thématique contemporaine permet des cartes beaucoup plus détaillées où les quantités continues peuvent être représentées par des échelles de couleurs de très hautes gammes. Les avantages: plus objectif et détaillé. Les lecteurs de carte peuvent potentiellement recréer les données source avec plus de précision.

Alors, quel est le but plus profond de votre carte?

Souhaitez-vous être plus objectif en explorant les variations détaillées présentes dans les données? Utilisez les échelles de couleurs continues. Ce concept de «carte comme outil d'investigation» s'accompagne de (nouveaux) noms comme «visualisation des données» et «cartographie thermique».

Souhaitez-vous raconter une histoire simple? Utilisez des échelles de couleurs discrètes. C'est "la carte comme outil de communication".

Puisque votre carte est déjà très généralisée spatialement, dans les régions de vote, je pourrais suggérer d'utiliser des échelles de couleurs continues comme compromis - vous avez une discrétisation spatiale mais une continuité statistique. Juste une idée.

En fin de compte, cela dépend de vous. Pourquoi ne pas expérimenter quelques variations?


Je pense que si l'histoire de la visualisation avait commencé avec des ordinateurs modernes au lieu d'une impression bon marché avec un nombre limité de couleurs d'encre, les gens seraient plus prédisposés à utiliser des échelles de couleurs continues.
Andy

1

Je vois deux options:

a) vous n'utilisez que des bacs: (les chiffres ne sont qu'un exemple)

  • Le candidat rouge a> 50% - 70% des votes -> couleur rouge clair
  • Le candidat rouge a> 70% des votes -> la couleur est rouge foncé
  • pour le bleu en conséquence

b) vous utilisez une rampe de couleur.

  • colorramp continu du rouge clair / bleu au rouge foncé / bleu avec une cartographie continue des valeurs de> 50% à 100% aux couleurs de la lumière au rouge foncé / bleu.

Ce que vous avez choisi dépend de ce que vous souhaitez communiquer avec la carte. Si l'information "gagne" et "gagne par xy%" suffit, choisissez a). Si vos lecteurs devraient être en mesure d'estimer le nombre de% de candidats rouges ou bleus en tête, choisissez b)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.