J'essaie d'utiliser le clustering de la canopée pour fournir des clusters initiaux pour KMeans dans mahout.
Existe-t-il un moyen de déterminer / approximer les valeurs des seuils de distance T1 et T2 de manière algorithmique? En ce moment, j'ai T1 = 100 et T2 = 1, ce qui ne semble rien faire de bien.