J'ai une question très basique sur le clustering. Après avoir trouvé k clusters avec leurs centroïdes, comment dois-je procéder pour interpréter les classes des points de données que j'ai groupés (en attribuant des étiquettes de classe significatives à chaque cluster). Je ne parle pas de validation des clusters trouvés.
Peut-on le faire en fonction d'un petit ensemble de points de données étiquetés, calculer à quel cluster ces points étiquetés appartiennent et en fonction du type et du nombre de points que chaque cluster reçoit, décider de l'étiquette? Cela semble assez évident, mais je ne sais pas comment il est standard d'attribuer des étiquettes aux clusters de cette façon.
Pour être clair, je veux effectuer un clustering non supervisé qui n'utilise aucune étiquette pour trouver d'abord mes clusters. Après avoir trouvé les clusters, je veux attribuer des étiquettes de classe significatives aux clusters en fonction des propriétés de quelques exemples de points de données.