Étant donné un ensemble de points de données où nous exécutons K-means sur et obtenons les clusters .
Maintenant, si nous créons un nouvel ensemble de données où et et exécutons K-means sur pour obtenir les clusters .
Dans quelles conditions et avons-nous la garantie d'obtenir les mêmes grappes?
Supposons que K-means utilise la distance euclidienne et a les mêmes conditions initiales sur les deux algorithmes, c'est-à-dire que si les centres initiaux de X sont alors les centres initiaux de Y sont où .
Jusqu'à présent, j'ai pensé que doit être de rang complet et peut être n'importe quel vecteur. Cependant, je n'ai pas pu le prouver.