Formatage des graphiques: quand est-il approprié d'utiliser un remplissage sous un graphique linéaire?

13

Il s'agit d'une question de visualisation des données - j'espère que vous pouvez la poser ici.

Quand est-il approprié d'utiliser un remplissage sous un graphique linéaire pour une série chronologique, comme le graphique ci-dessous? (qui affiche les temps de ping sur une journée)

Graphique linéaire avec remplissage en dessous

Je suppose qu'il est plus courant d'utiliser une ligne simple, sans remplissage en dessous, mais est-il acceptable d'utiliser un remplissage pour la variété visuelle?

Je serais particulièrement intéressé à connaître toute recherche perceptuelle sur le sujet ou tout guide de style.

data-visualization

— Richard
source

1

Si 0sla limite inférieure naturelle est et que vous la montrez, alors pourquoi pas?

— ttnphns

1

Demandez une autre manière - pourquoi utiliser le remplissage s'il n'est pas nécessaire? Imaginez que vous vouliez ajouter une autre ligne de tendance et que les choses se compliquent inutilement. Je séparerais également l'unité et l'échelle de l'axe des y.

— martin

11

Il y a un peu d'art à équilibrer les aspects esthétiques et informatifs d'un graphique. D'éminents consultants / auteurs en visualisation comme Edward Tufte et Stephen Few choisissent une esthétique minimale qui évite la distraction des parties informatives du graphique. Cependant, pour certains publics, un petit épanouissement est justifié - voir l'application journalistique d'Alberto Cairo de la visualisation de données, par exemple.

L'angle de recherche perceptuel est que chaque élément graphique communique un message, dont certains dont nous ne sommes pas conscients parce que notre cortex visuel le traite (" traitement pré-attentif "). Des éléments supplémentaires, même redondants, peuvent entraîner un traitement supplémentaire. Le graphique approprié dépend du message à communiquer et du public.

Pour votre question spécifique, une ligne connectée met l'accent sur une tendance (et la variation d'une tendance). La zone remplie souligne l'écart par rapport à la ligne de base. Un graphique à barres ou un graphique à aiguilles mettrait l'accent sur des événements discrets s'écartant d'une ligne de base.

Le contexte du graphique est également important. Si vous avez une grille de graphiques serrés, le remplissage aidera à associer chaque ligne à sa ligne de base.

Enfin, une autre considération pour l'ajout d'éléments graphiques / redondants redondants est qu'il est plus difficile d'étendre le graphique avec des éléments plus informatifs. Par exemple, vous pouvez mettre en évidence des valeurs spéciales, superposer d'autres lignes de tendance ou bandes de superposition, comme dans la maquette suivante.

entrez la description de l'image ici

— xan
source

1

Je suis d'accord avec ça. À moins que le graphique ne soit coloré parce qu'il s'agit de la couverture d'un magazine / livre (et que les gens du marketing veulent qu'il soit coloré), la couleur doit être utilisée pour informer. Si le graphique semble "ennuyeux", le coupable est le fait que les informations sous-jacentes ne sont pas du tout très intéressantes ou pas très intéressantes au format graphique en ligne. Dans de tels cas, il serait peut-être plus utile dans un graphique à secteurs, un tracé radar ou autre chose.

— rocinante

1

Je suggère de ne pas utiliser de graphique à secteurs. Il est plus difficile de percevoir les différences de longueur d'arc et de surface de coin que les différences de hauteur. Si vous ne me croyez pas, comparez un graphique circulaire dans les ratios 32:34:33 au même graphique à barres. Lequel est le plus facile à lire?

— shadowtalker

2

Je parlais en termes généraux, pas spécifiquement pour le graphique ci-dessus. Chaque type de graphique a ses mérites. Un certain type de graphique n'est pas approprié dans toutes les situations.

— rocinante

4

Quelques points supplémentaires à considérer:

Comme mentionné dans un commentaire, un sous-remplissage est largement inapproprié si l'axe x n'est pas à un point zéro naturel y. Cela peut être dû au fait que l'axe des y est mis à l'échelle pour commencer à un nombre différent de zéro, ou parce que les unités utilisées n'ont pas d'interprétation du zéro naturel (par exemple Kelvin a un zéro naturel, tandis que Celsius n'en a pas.)

Deuxièmement, un cas où un sous-remplissage est particulièrement valable est celui où les données elles-mêmes pourraient être considérées comme sous-remplies. Par exemple, un graphique en courbes de la hauteur d'une montagne a un sens d'être sous-rempli, la couleur de remplissage représente la terre, tandis que non remplie représente l'air.

Un exemple connexe pourrait être les données de comptage. Si nous empilions tous les individus à chaque point x, nous obtiendrions un graphique à barres. Si l'interpolation entre les barres est logique, nous nous retrouverions avec un graphique linéaire avec un sous-remplissage.

Cette image de «l'affichage visuel des informations quantitatives» pourrait l'expliquer un peu mieux. Il montre quelles unités militaires étaient en Europe pendant la seconde guerre (je pense). Empiler les unités à chaque instant vous donne un graphique à barres sous-rempli. Tracer une ligne au-dessus des données vous donne un graphique en courbes sous-rempli.

— timcdlucas
source

2

... Les unités militaires américaines étaient en Europe pendant la Première Guerre mondiale (les dates 1917 et 1918 racontent l'histoire).

— Nick Cox

@nickCox Bien sûr. Je ne sais pas pourquoi je n'ai pas vu ça.

— timcdlucas

4

Les deux réponses précédentes couvrent les principaux points importants, mais il y a quelques points qui doivent encore être mentionnés.

Tout d'abord, je dois dire que je ne suis pas d'accord avec l'approche minimaliste extrême de la représentation graphique - que toute encre redondante doit disparaître. Une variation distrayante et non significative devrait disparaître. Mais une zone solide par rapport à une seule ligne peut mieux attirer l'attention et communiquer plus en un coup d'œil. Et comme vous le dites, cela peut ajouter une "variété visuelle".

Cependant, comme le souligne @xan, ce coup d'œil rapide interprète également une zone différemment d'une ligne, de manière partiellement subconsciente.

Un graphique en aires implique une quantité totale qui s'accumule à mesure que vous avancez le long de l'axe des x. Si vous comparez deux graphiques et que l'un a une plus grande zone remplie, votre coup d'œil vous indiquera qu'il a un total plus important quelles que soient les valeurs de début et de fin.

En revanche, un graphique linéaire montre une valeur changeante. L'accent est mis sur le changement de position d'un point à l'autre, et non sur le total accumulé.

Alors, quand devriez- vous utiliser un graphique en aires?

lorsque les valeurs représentent une quantité claire avec un point zéro défini indiqué sur le graphique;
lorsque la valeur représente une quantité ajoutée (ou supprimée) à chaque point, comme des précipitations quotidiennes normales ou un profit / perte mensuel;
lorsque la valeur représente une distribution d'une population, ce qui signifie que la surface totale sous la courbe représente la taille totale de l'échantillon, telle que la courbe en cloche du nombre d'élèves avec différentes notes (essentiellement un histogramme lissé).

L'idée est que, lors de la lecture du graphique, si vous prenez deux points sur l'axe des x, la zone représentée entre eux devrait représenter une quantité réelle de quelque chose qui s'accumule dans cette plage. Pour cette raison, si vous incluez des valeurs négatives, je vous recommande d'utiliser des couleurs opposées pour les zones négatives et positives pour souligner qu'elles s'annulent dans le total.

Quand ne devriez-vous pas utiliser un graphique en aires?

lorsque le point zéro est arbitraire (comme dans la température non absolue, comme l'a dit @timcdlucas), invalide (comme dans les mesures qui sont un rapport de deux valeurs, comme un taux de change), ou non montré sur le graphique pour des raisons d'espace;
lorsque les valeurs indiquées par la hauteur de la ligne représentent déjà une mesure cumulative, comme les précipitations totales à ce jour (pour le mois / l'année) ou la dette / l'épargne;
lorsque les valeurs représentent la position / valeur d'une seule entité changeante plutôt qu'une accumulation;
lorsque vous souhaitez comparer plusieurs lignes sur le même graphique (si vous ne pouvez pas voir toute la zone, vous perdez le sens - comparez les graphiques de zone côte à côte à la place).

Avec ces directives à l'esprit, votre graphique ping peut être interprété de deux manières.

D'une part, si vous considérez la vitesse de ping comme une variable unique qui change au cours de la journée, un simple graphique linéaire serait le plus approprié.

D'un autre côté, si vous comparez les modèles de vitesse de ping quotidiens de deux réseaux différents (ou le même réseau à différents jours / périodes de temps), alors vous voudrez peut-être souligner le temps total requis pour les tâches réseau. Par exemple, si votre graphique avait plusieurs pics, au lieu d'un seul, un graphique linéaire mettrait l'accent sur la variabilité de la vitesse tandis qu'un graphique surfacique mettrait l'accent sur le retard total.

Comparer:
Graphique linéaire Même graphique avec zone remplie
le total cumulé est légèrement plus élevé dans la première moitié du graphique (à gauche de la ligne rouge) que dans le second, même si les pics atteignent des valeurs maximales plus élevées à droite. Le remplissage souligne ce bloc solide sur la gauche, de sorte qu'il s'équilibre mieux avec les pics.

(Pardonnez la mauvaise qualité de l'image - je n'ai pas pu trouver comment faire pour que R fasse un graphique en aires! J'ai dû exporter et éditer séparément.)

— AmeliaBR
source