Nous trouvons les centres de cluster et attribuons des points à k différents groupes de cluster dans le clustering k-means, qui est un algorithme très bien connu et qui se retrouve presque dans tous les packages d'apprentissage automatique du réseau. Mais la partie manquante et la plus importante à mon avis est le choix d’un k correct. Quel est le meilleur rapport qualité-prix? Et qu'entend-on par meilleur ?
J'utilise MATLAB pour le calcul scientifique où regarder les tracés de silhouette est donné comme un moyen de décider de k discuté ici . Cependant, je serais plus intéressé par les approches bayésiennes. Toutes les suggestions sont appréciées.