J'ai un tas de points de données avec la latitude et la longitude. Je veux utiliser R pour les regrouper en fonction de leur distance.
J'ai déjà regardé cette page et essayé le paquet clustTool . Mais je ne suis pas sûr que la fonction clust dans clustTool considère les points de données (lat, lon) comme des données spatiales et utilise la formule appropriée pour calculer la distance qui les sépare.
Je veux dire que je ne vois pas comment ils différencient les données spatiales des données ordinales. Je crois que le calcul de la distance entre deux points de la carte (spatiale) et deux nombres normaux est différent. (N'est-ce pas?)
De plus, que se passe-t-il si je souhaite prendre en compte un troisième paramètre dans ma classification?
Comme par exemple si j'ai (lat, lon) et un autre paramètre.
Comment est calculée la distance?
L'autre problème que j'ai avec clustTool est qu'il est conçu avec une interface graphique à l'esprit. Je ne sais pas comment je peux ignorer la surcharge de l'interface graphique dans la bibliothèque car je n'en ai pas besoin.
Quelles sont les options disponibles dans R pour l'analyse par cluster des données spatiales?
Cluster
, acceptent les matrices de dissimilarité ou de distance comme entrée. Cela les rend parfaitement généraux et applicables au regroupement sur la sphère, à condition que vous puissiez calculer vous-même les distances, ce qui est simple.