Dans mon domaine, la façon habituelle de tracer des données appariées consiste en une série de segments de ligne en pente mince, en les superposant à la médiane et à l'IC de la médiane pour les deux groupes:
Cependant, ce type de tracé devient beaucoup plus difficile à lire car le nombre de points de données devient très important (dans mon cas, j'ai de l'ordre de 10000 paires):
Réduire l'alpha aide un peu, mais ce n'est toujours pas génial. En cherchant une solution, je suis tombé sur ce document et j'ai décidé d'essayer de mettre en œuvre un «tracé de ligne parallèle». Encore une fois, cela fonctionne très bien pour un petit nombre de points de données:
Mais il est encore plus difficile de faire en sorte que ce type d'intrigue est très grand:
Je suppose que je pourrais montrer séparément les distributions pour les deux groupes, par exemple avec des boîtes à moustaches ou des violons, et tracer une ligne avec des barres d'erreur en haut montrant les deux médianes / CI, mais je n'aime vraiment pas cette idée, car elle ne véhiculerait pas la nature jumelée des données.
Je ne suis pas non plus trop intéressé par l'idée d'un nuage de points 2D: je préférerais une représentation plus compacte, et idéalement une représentation dans laquelle les valeurs des deux groupes sont tracées le long du même axe. Par souci d'exhaustivité, voici à quoi ressemblent les données en tant que nuage 2D:
Quelqu'un connaît-il une meilleure façon de représenter les données appariées avec un échantillon de très grande taille? Pourriez-vous me lier à quelques exemples?
Éditer
Désolé, je n'ai clairement pas fait un assez bon travail pour expliquer ce que je cherche. Oui, le nuage de points 2D fonctionne, et il existe de nombreuses façons de l'améliorer afin de mieux transmettre la densité des points - je pourrais coder par couleur les points selon une estimation de la densité du noyau, je pourrais faire un histogramme 2D , Je pourrais tracer des contours au-dessus des points etc., etc ...
Cependant, je pense que c'est exagéré pour le message que j'essaie de transmettre. Je ne m'inquiète pas vraiment de montrer la densité 2D de points en soi - tout ce que je dois faire est de montrer que les valeurs pour les «barres» sont généralement plus grandes que celles pour les «points», d'une manière aussi simple et claire que possible , et sans perdre la nature appariée essentielle des données. Idéalement, je voudrais tracer les valeurs appariées pour les deux groupes le long des mêmes axes plutôt que orthogonaux, car cela facilite la comparaison visuelle.
Il n'y a peut-être pas de meilleure option qu'un nuage de points, mais j'aimerais savoir s'il existe des alternatives qui pourraient fonctionner.
bar
sur l'horizontale etdot
sur l'axe vertical comme un nuage de points?