Dans les méthodes de clustering telles que K-means , la distance euclidienne est la métrique à utiliser. Par conséquent, nous calculons uniquement les valeurs moyennes au sein de chaque cluster. Et puis des ajustements sont effectués sur les éléments en fonction de leur distance à chaque valeur moyenne.
Je me demandais pourquoi la fonction gaussienne n'est pas utilisée comme métrique? Au lieu d'utiliser xi -mean(X)
, nous pouvons utiliser exp(- (xi - mean(X)).^2/std(X).^2)
. Ainsi, non seulement la similitude entre les grappes est mesurée (moyenne), mais la similitude au sein de la grappe est également prise en compte (std). Est-ce également équivalent au modèle de mélange gaussien ?
C'est au-delà de ma question ici, mais je pense que le décalage moyen peut se poser la même question ci-dessus.