Je suis d'accord que le graphique est trompeur en ce sens qu'il prétend montrer qu'il n'y a pas de points de données dans le quadrant catégoriquement décrit comme un pourcentage élevé de voix en congé, un pourcentage élevé de diplômés. Ce qui est haut et bas devient relatif aux limites de l'axe, pas aux données réelles. Bien qu'il soit théoriquement possible d'avoir une unité avec une population qui est à 100% diplômée d'université, une telle unité n'existe pas. Vous n'avez pas besoin d'inventer des points de données pour produire un graphique trompeur: un axe brisé montrant un changement exagéré est un exemple qui n'est pas trop différent de celui-ci.
Une manière plus objective de visualiser ces données serait de définir les limites de l'axe du nuage de points au maximum / min des données, puis de diviser le graphique en quadrants d'une zone égale.
La raison pour laquelle j'opterais pour l'aire égale des quadrants est que les quadrants montrent une relation linéaire équivalente entre les variables. Les descriptions catégorielles des quadrants «haut» et «bas» sont traitées comme équivalentes, les zones devraient donc l'être également.
Si, à la place, nous voulons utiliser les quadrants comme une autre façon de décrire quantitativement les données, nous pourrions définir les bordures des quadrants à la moyenne de chaque variable, comme indiqué dans Visualisation des données avec des exemples R: 100 (disponible en aperçu sur Google Books, p283, 286).
Pour ajouter une autre couche analytique à une visualisation de nuage de points, nous pouvons utiliser la couleur et la taille des points. Par exemple, la couleur peut être utilisée pour séparer les villes universitaires des autres, afficher la participation électorale dans un dégradé ou mettre en évidence les résultats des élections générales pour ces circonscriptions. Je ne sais pas si la taille sera efficace avec autant de points de données, mais vous pouvez potentiellement enquêter sur différentes bandes de population, telles que 65+, et comment elles sont représentées dans les données.
À mon avis, il y a également deux mises en garde importantes qui méritent d'être prises en compte lorsque l'on regarde ce graphique: premièrement, qu'il compte tous les diplômés, qu'ils aient voté ou non au référendum, et deuxièmement, qu'il inclut les diplômés résidents titulaires d'un passeport européen qui n'a pas pu voter au référendum (en supposant que les données sources sont basées sur le recensement).