Quelqu'un peut-il me dire les facteurs qui affectent les besoins en mémoire de -signifie un regroupement avec un peu d'explication?
Quelqu'un peut-il me dire les facteurs qui affectent les besoins en mémoire de -signifie un regroupement avec un peu d'explication?
Réponses:
Des algorithmes comme Lloyds peuvent être implémentés avecvaleurs en virgule flottante mémoire uniquement. L'algorithme k-means de MacQueens ne devrait avoir besoin Mémoire.
Cependant, comme la plupart des utilisateurs voudront savoir quel point appartient à quel cluster, presque toutes les implémentations que vous trouverez utiliseront Mémoire.
En d'autres termes, l'utilisation de la mémoire par k-means est essentiellement la taille des données de sortie .
Je suis récemment tombé sur une note d'une implémentation scipy de l'algorithme k-means dans scipy.cluster.vq.py
Notes ----- This could be faster when number of codebooks is small, but it becomes a real memory hog when codebook is large. It requires N by M by O storage where N=number of obs, M = number of features, and O = number of codes.