Disons donc que j'ai un tas de points de données dans R ^ n, où n est assez grand (comme, 50). Je sais que ces données se répartissent en 3 clusters, et je sais à quel cluster chaque point de données appartient. Tout ce que je veux faire est de visualiser ces clusters en 2D de manière à maximiser la séparation visuelle entre les clusters que je vois, dans le but de prouver que les clusters sont facilement séparables en fonction de l'emplacement du point de données dans R ^ n seul.
Jusqu'à présent, la façon dont j'y ai procédé consiste à effectuer une transformation PCA sur les points de données, puis à visualiser des paires de PC au hasard jusqu'à ce que j'en trouve une où les clusters semblent être assez nettement séparés. Cette approche semble cependant assez ad hoc, et il semble qu'il devrait y avoir un moyen facile de trouver une rotation de type PCA des données qui, au lieu de maximiser la variance globale, maximise la séparation entre les grappes.
Existe-t-il une technique standard qui permet cela? Sinon, des idées sur la façon de créer une telle transformation?