J'essaie de comprendre les méthodes de clustering.
Ce que je pense avoir compris:
Dans l'apprentissage supervisé, les catégories / étiquettes de données auxquelles sont affectées sont connues avant le calcul. Ainsi, les étiquettes, classes ou catégories sont utilisées afin «d'apprendre» les paramètres qui sont vraiment importants pour ces clusters.
Dans l'apprentissage non supervisé, les ensembles de données sont affectés à des segments, sans que les clusters soient connus.
Est-ce à dire que si je ne sais même pas quels paramètres sont cruciaux pour une segmentation, je devrais préférer un apprentissage supervisé?