J'ai plusieurs distributions (10 distributions dans la figure ci-dessous).
En fait ce sont des histogrammes: il y a 70 valeurs sur l'axe des x qui sont les tailles de certaines particules dans une solution et pour chaque valeur de x la valeur correspondante de y est la proportion de particules dont la taille est autour de la valeur de x.
Je voudrais regrouper ces distributions. Actuellement j'utilise un clustering hiérarchique avec la distance euclidienne par exemple. Je ne suis pas satisfait du choix de la distance. J'ai essayé la distance théorique de l'information telle que Kullback-Leibler mais il y a beaucoup de zéros dans les données et cela cause des difficultés. Avez-vous une proposition de distance appropriée et / ou une autre méthode de clustering?