J'essaie de comparer visuellement comment trois publications d'actualités différentes couvrent différents sujets (déterminées par un modèle de sujet LDA). J'ai deux méthodes connexes pour le faire, mais j'ai reçu beaucoup de commentaires de collègues que ce n'est pas très intuitif. J'espère que quelqu'un là-bas aura une meilleure idée pour visualiser cela.
Dans le premier graphique, je montre les proportions de chaque sujet dans chaque publication, comme ceci:
C'est assez simple et intuitif pour presque tous ceux à qui j'ai parlé. Cependant, il est difficile de voir les différences entre les publications. Quel journal couvre plus quel sujet?
Pour y arriver, j'ai représenté graphiquement la différence entre la publication avec la proportion de sujets la plus élevée et la deuxième plus élevée, colorée par la publication la plus élevée. Comme ça:
Ainsi, l'énorme barre pour le football, par exemple, est vraiment la distance entre al-Ahram English et Daily News Egypt (n ° 2 dans la couverture du football), et elle est colorée en rouge car Al-Ahram est n ° 1. De même, les essais sont verts car Egypt Independent a la proportion la plus élevée, et la taille de la barre est la distance entre Egypt Independent et Daily News Egypt (# 2 encore).
Le fait que je doive expliquer que le tout en deux paragraphes est un signe assez sûr que le graphique échoue au test d'autosuffisance. Il est difficile de dire ce qui se passe vraiment en le regardant.
Avez-vous des suggestions générales sur la façon de mettre en évidence visuellement la publication dominante pour chaque sujet de manière plus intuitive?
Edit: Données pour jouer avec: Voici la dput
sortie de R , ainsi qu'un fichier CSV .
Edit 2: Voici une version préliminaire du tracé de points, avec les diamètres des points proportionnels à la proportion du sujet dans le corpus (c'est ainsi que les sujets ont été triés à l'origine). Bien que je doive encore le peaufiner un peu plus, cela semble beaucoup plus intuitif que ce que je faisais auparavant. Merci tout le monde!