Réponses:
Aucun des outils prêts à l'emploi d'ArcGIS (ou de tout autre SIG, AFAIK) ne fera le travail correctement.
Dans un problème comme celui-ci, vous devez quantifier ce que vous entendez par «clustering», puis vous devez poser un modèle de probabilité pour évaluer si le degré de clustering mesuré pourrait avoir été produit par des hasards accidentels.
Comme exemple de procédure, vous pouvez choisir de mesurer le regroupement en termes de distances typiques entre les bâtiments de type x et le bâtiment de type y le plus proche . Il s'agit d'un calcul simple: il suffit de représenter les deux ensembles de bâtiments par des couches de points distinctes et d'effectuer une jointure spatiale des Y aux X. Le tableau d'attribut, qui a encore un enregistrement pour chaque type x bâtiment, comprendra maintenant la distance au plus proche y . Vous pouvez utiliser la distance moyenne comme mesure.
Tester si cela pourrait être le résultat du hasard est plus difficile. Une interprétation plausible de ce cadre est que la présence antérieure de bâtiments de type y a encouragé le développement de bâtiments de type x relativement proches des y . Sinon, nous pourrions émettre l'hypothèse que les bâtiments de type x auraient pu être construits partout où d' autres bâtiments sont également apparus. Cela conduit au test de permutation simple suivant . Créez une couche de points de tous les emplacements possibles où des bâtiments de type x peuvent être apparus. Cette couche pourrait être l'emplacement de tous les bâtiments de la zone érigés pendant la même période que le xles bâtiments étaient (y compris les x bâtiments eux-mêmes, bien sûr). Joignez spatialement la couche y pour obtenir les distances au bâtiment de type y le plus proche . Le reste du calcul fonctionne hors de la table attributaire: les calculs géographiques sont effectués. Ce que vous allez faire est d'utiliser à plusieurs reprises un générateur de nombres aléatoires pour prélever un simple échantillon aléatoire de tous ces bâtiments, chaque échantillon ayant exactement autant d'éléments que vous avez de bâtiments de type x . Calculez la distance moyenne pour cet échantillon. Répétez jusqu'à ce que vous ayez de nombreuses statistiques de distance moyenne. Si presque toutes ces distances moyennes obtenues au hasard sont supérieures à la distance moyenne que vous avez mesurée pour le xde type bâtiments, vous pouvez conclure que les x ne sont pas regroupés par hasard: l'effet est réel.
(De tels calculs sont mieux programmés sur une plate-forme adaptée à de telles fins, comme `` R '', mais presque tous les logiciels informatiques peuvent être mis en service, même Excel. La programmation est très, ne nécessitant guère plus que de savoir comment écrire des boucles et sélectionner éléments de tableaux au hasard.)
Cette approche de test de permutation est supérieure aux solutions préprogrammées car elle tient explicitement compte des schémas de développement des bâtiments dans ce domaine. Si vous ne le faites pas, vous souvent y trouver des preuves « importantes » de regroupement, mais vous ne pouvez pas conclure quoi que ce soit utile de lui, parce que le regroupement peut avoir été causé par d' autres facteurs tels que les modèles de routes, les lieux de des sites propices au développement, et bien d'autres choses.
Bien sûr, votre méthode d'analyse des données doit dépendre du problème de fond motivant l'analyse.
Mais voici quelques idées:
Fonctionnement de l'analyse de grappes spatiales multi-distances: la fonction k de Ripley (statistiques spatiales) , où i et j dans l'équation dénoteraient vos bâtiments x et y. La fonction K de Ripley fournira une inférence probabiliste.
Il existe des algorithmes complexes pour la découverte de modèles de colocalisation que vous pouvez google.
Je n'ai jamais fait d'analyse de grappe dans SIG moi-même, mais serait-il plus facile si vous créiez des points / polygones pour représenter une grappe donnée de X et / ou Y. Par exemple, si vous créiez des points pour signifier la construction de Y, vous pourriez alors utilisez l' outil Distance de point pour obtenir tous les points du bâtiment X à une distance donnée de vos emplacements d'origine.
Sinon, la création d'un tampon autour des bâtiments de type Y et la sélection de tous les bâtiments de type X obtiendront le même résultat si vous ne disposez pas d'ArcInfo.
Vous pouvez combiner les deux couches en ajoutant une colonne binaire (0,1) pour identifier si le bâtiment provient de X ou Y.
À partir de là, en utilisant GeoDa, vous pouvez identifier l'auto-corrélation spatiale locale (clustering) et déterminer si elle était élevée-basse (une couche regroupée autour de l'autre couche) basse-haute (l'inverse) ou haute-haute ou basse-basse (auto- clustering). Guide de l'utilisateur ici (.pdf)