Il y a des avantages et des inconvénients à chaque façon de procéder. Pour faire une histoire courte, je recommanderais de créer des «bacs». Quelques notes pour vous aider à choisir et à concevoir des choroplèthes en général:
Une cartographie directe de la valeur des données en couleur (une carte `` non classée '') pourrait être considérée comme le moyen le plus précis d'afficher les données, mais les cartes classées (cartes avec `` bacs '') peuvent être plus lisibles pour plusieurs raisons.
Si vous utilisez une carte non classée et que les données sont asymétriques, ou qu'il y a des valeurs aberrantes dans l'ensemble de données, les valeurs aberrantes se démarqueront clairement, tandis que de nombreux polygones peuvent se révéler de couleur très similaire. Cela mettrait en évidence le fait que quelques domaines sont radicalement différents des autres (dans votre cas, si quelques domaines avaient une préférence significativement plus grande pour un candidat par rapport à l'autre que la plupart des domaines), mais il est plus difficile de distinguer les relations au sein de le reste de la zone de la carte.
Dans une carte classée, chaque classe doit être visuellement distincte, il est donc facile de dire où se trouve une zone dans les données, au prix de certaines des distinctions plus fines qui sont perdues.
Un autre problème est que la perception de l'intensité des couleurs n'est pas strictement linéaire. Donc, si vous aviez une rampe de couleur du blanc au bleu, correspondant à aucun candidat ne recevant plus de votes pour le plomb maximum pour un candidat, la couleur qui est à 75% entre le blanc et le bleu pourrait ne pas être perçue comme étant 75% de la entre les deux couleurs, et donc l'utilisateur de la carte ferait une fausse hypothèse sur la valeur des données qu'il représentait.
Les cartes classées, en revanche, peuvent avoir la couleur de chaque classe soigneusement choisie pour être perçue clairement et distinctement. Je n'en sais pas assez pour concevoir un ensemble de couleurs qui le fait, mais Cynthia Brewer et Mark Harrower le font, et ils ont créé colorbrewer2.org , un excellent outil (gratuit) pour aider les cartographes à choisir de bons schémas de couleurs pour leurs cartes. Vous pouvez choisir parmi une variété de schémas, choisir le nombre de classes, et cela donne un aperçu de ce à quoi le schéma pourrait ressembler dans la pratique, et les valeurs RBG, HEX ou CMJN pour chaque couleur du schéma. Très utile et simplement amusant à jouer.
Pour ces raisons, je recommanderais de faire une carte classée. Le nombre recommandé de classes est généralement un nombre impair compris entre 5 et 9. L'utilisation d'un nombre impair donne une valeur moyenne distincte, et ce nombre de classes est généralement considéré comme suffisant pour donner des distinctions utiles dans les données, mais pas trop pour devenir impossible à distinguer. Puisque vous utilisez un schéma de couleurs divergentes (couleur claire au milieu, deux couleurs différentes à chaque extrémité), vous pouvez vous en sortir avec plus de classes, peut-être 7-9.
Rendez-vous sur Colorbrewer, choisissez "divergentes" pour la nature de vos données, sélectionnez le schéma de couleurs rouge à bleu, choisissez votre nombre de classes, et c'est parti!
Pour une grande partie de cela, il n'y a pas de règle stricte. La norme est la suivante: "la carte communique-t-elle bien les données?" Jouer avec les paramètres jusqu'à ce que vous obteniez quelque chose qui "fonctionne" peut être une bonne chose.
Maintenant, une note sur la fabrication de choroplèthes. Je m'excuse si cela vous est familier:
Un point d'intérêt lors de l'utilisation d'une carte classée est la façon dont les données sont divisées en classes. Est-il cassé à intervalles égaux le long de la plage? Un certain nombre de points de données sont-ils attribués à chaque classe? Un certain nombre d'écarts-types par rapport à la moyenne? Est-il cassé lors de ruptures "naturelles" des données? La méthode que vous utilisez fait une différence dans la façon dont les données sont représentées. Je ne suis pas un grand programmeur et je ne sais pas quelle méthode le script que vous liez utilise. Les «pauses naturelles» sont généralement un bon choix. Pour les données avec un point médian clair comme les données d'interrogation (le point médian étant une répartition 50/50), les écarts-types peuvent être utiles.
Lors de la réalisation d'un choroplèthe, il est bon d'utiliser des données standardisées sur une unité de surface. Par exemple, au lieu d'utiliser la population totale d'un comté, il est préférable de cartographier la population par mile carré dans chaque comté. La raison étant qu'une zone plus grande aura tendance à contenir plus de personnes qu'une zone plus petite, donc la division par la zone de chaque unité cartographiée donne une représentation plus précise des tendances. Les données peuvent également être normalisées en pourcentage. Par exemple, un taux de pauvreté plutôt qu'un certain nombre de personnes en situation de pauvreté.
Pour vos besoins, il est plus révélateur de cartographier le pourcentage de votes exprimés pour un candidat que le nombre brut de votes exprimés pour ce candidat.
Quoi qu'il en soit, j'espère que cela est utile et que votre carte se révèle bien!
Pour une grande partie de cette discussion, je me suis inspiré de la cartographie thématique et de la géovisualisation de Slocum et al.