La plupart des algorithmes de clustering que j'ai vus commencent par créer des distances de chaque point entre tous les points, ce qui devient problématique sur des ensembles de données plus importants. Y en a-t-il un qui ne le fait pas? Ou le fait-il dans une sorte d'approche partielle / approximative / échelonnée?
Quel algorithme / implémentation de clustering prend moins d'espace O (n ^ 2)?
Existe-t-il une liste d'algorithmes et de leurs besoins en temps et en espace quelque part?