Regroupement avec des mesures de distance asymétriques


9

Comment regrouper une entité avec une mesure de distance asymétrique?

Par exemple, supposons que vous regroupiez un ensemble de données avec des jours de la semaine comme entité - la distance du lundi au vendredi n'est pas la même que la distance du vendredi au lundi.

Comment intégrez-vous cela dans la mesure de distance de l'algorithme de clustering?

Réponses:


3

Si la distance MF est asymétrique parce que l'avenir est différent du passé, alors un véritable regroupement asymétrique est nécessaire. Premièrement, une fonction de distance asymétrique doit être définie.

Une façon de procéder à un regroupement asymétrique, étant donné une fonction de distance, consiste à intégrer les données d'origine dans un nouvel espace de coordonnées. Voir «Structures géométriques de certains modèles sans distance pour les MDS asymétriques» par Naohito Chino et Kenichi Shiraiwa, Behaviormetrika, 1992 ( pdf ). C'est ce qu'on appelle HCM (le modèle canonique hermitien).

H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

Cela transforme les données en un espace de nombres complexes. Une fois les données incorporées, la distance entre les objets x et y n'est plus que x * y, où * est le transposé conjugué. À ce stade, vous pouvez exécuter k-means sur les vecteurs complexes.

Un regroupement spectral asymétrique a également été effectué, voir la thèse de Stefan Emilov Atev, «Using Asymmetry in the Spectral Clustering of Trajectories», Université du Minnesota, 2011, qui donne le code MATLAB pour un algorithme spécial.


1

Vous pouvez prendre une sorte de moyenne (comme une moyenne arithmétique ou, pour les distributions de probabilité, la racine carrée de la divergence Jensen – Shannon.)


1

Vous devriez jeter un œil aux statistiques circulaires (si vous voulez travailler "dans" une semaine de réglage)


1

XXTX

|days apart|

xD

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.