Une autre façon simple consiste à utiliser essentiellement le tri du tableau 1D: c'est-à-dire itérer sur chaque point et obtenir les valeurs qui sont à une distance minimale de celui-ci dans les directions positive et négative. Par exemple:
data = [1,2,3,4,5,6,7,8,9,10,12]
k = 5
for a in data:
print {'group': sorted(k, key=lambda n: abs(n-a))[0:k], 'point': a}
donnera:
{'group': [1, 2, 3, 4, 5], 'point': 1}
{'group': [2, 1, 3, 4, 5], 'point': 2}
{'group': [3, 2, 4, 1, 5], 'point': 3}
{'group': [4, 3, 5, 2, 6], 'point': 4}
{'group': [5, 4, 6, 3, 7], 'point': 5}
{'group': [6, 5, 7, 4, 8], 'point': 6}
{'group': [7, 6, 8, 5, 9], 'point': 7}
{'group': [8, 7, 9, 6, 10], 'point': 8}
{'group': [9, 8, 10, 7, 6], 'point': 9}
{'group': [10, 9, 8, 12, 7], 'point': 10}
{'group': [12, 10, 9, 8, 7], 'point': 12}
Quels points, que les éléments proches d'un point particulier sont essentiellement sous son groupe. La seule chose à méditer dans cette technique est la variable k, qui est la taille fixe du cluster :-).