Il est mentionné ici qu'une des méthodes pour déterminer le nombre optimal de grappes dans un ensemble de données est la "méthode du coude". Ici, le pourcentage de variance est calculé comme le rapport de la variance entre les groupes à la variance totale.
J'avais du mal à comprendre ce calcul. Quelqu'un peut-il expliquer comment calculer le pourcentage de variance pour un ensemble de données représenté par la matrice d'entités , où est la dimension d'entité et est le nombre de points de données . J'utilise l'algorithme k-means pour le clustering.