Le contexte:
Au fil du temps, j'ai acquis un ensemble d'heuristiques sur la façon de tracer efficacement l'association entre deux variables numériques. J'imagine que la plupart des gens qui travaillent avec des données auraient un ensemble de règles similaire.
Des exemples de telles règles peuvent être:
- Si l'une des variables présente une asymétrie positive, envisagez de tracer cet axe sur une échelle logarithmique.
- S'il y a beaucoup de points de données (par exemple, n> 1000), adoptez une stratégie différente telle que l'utilisation d'une certaine forme de transparence partielle ou l'échantillonnage des données;
- Si l'une des variables prend un nombre limité de catégories discrètes, envisagez d'utiliser une parcelle de gigue ou de tournesol;
- S'il y a trois variables ou plus, envisagez d'utiliser une matrice de nuage de points;
- L'ajustement d'une certaine forme de ligne de tendance est souvent utile;
- Ajustez la taille du caractère de traçage à la taille de l'échantillon (pour un n plus grand, utilisez un caractère de traçage plus petit);
- etc.
Question:
J'aimerais pouvoir renvoyer les étudiants vers une page Web ou un site qui explique ces astuces et d'autres pour tracer efficacement les associations entre deux variables numériques, peut-être avec des exemples.
- Y a-t-il des pages ou des sites sur Internet qui font un bon travail à ce sujet?