J'ai lu que l'algorithme k-means ne converge que vers un minimum local et non vers un minimum global. Pourquoi est-ce? Je peux logiquement penser à la façon dont l'initialisation pourrait affecter le clustering final et il existe une possibilité de clustering sous-optimal, mais je n'ai rien trouvé qui puisse le prouver mathématiquement.
Aussi, pourquoi k-means est-il un processus itératif? Ne pouvons-nous pas simplement différencier partiellement la fonction objectif par rapport aux centroïdes, l'assimiler à zéro pour trouver les centroïdes qui minimisent cette fonction? Pourquoi devons-nous utiliser la descente en pente pour atteindre le minimum pas à pas?