J'ai un grand ensemble de données et une similitude cosinus entre eux. Je voudrais les regrouper en utilisant la similitude cosinus qui assemble des objets similaires sans avoir à spécifier au préalable le nombre de clusters que j'attends.
J'ai lu la documentation sklearn de DBSCAN et Affinity Propagation, où les deux nécessitent une matrice de distance (pas une matrice de similitude en cosinus).
Vraiment, je cherche juste un algorithme qui ne nécessite pas a) une métrique de distance et b) un nombre prédéfini de clusters .
Quelqu'un connaît-il un algorithme qui ferait cela?