J'ai un ensemble de données d'événements qui se sont produits au cours de la même période. Chaque événement a un type (il existe peu de types différents, moins de dix) et un emplacement, représentés comme un point 2D.
Je voudrais vérifier s'il existe une corrélation entre les types d'événements ou entre le type et l'emplacement. Par exemple, les événements de type A ne se produisent généralement pas là où se produisent les événements de type B. Ou peut-être que dans certaines régions, il y a surtout des événements de type C.
Quel type d'outils pourrais-je utiliser pour effectuer cela? Étant novice en analyse statistique, ma première idée a été d'utiliser une sorte de PCA (analyse en composantes principales) sur cet ensemble de données pour voir si chaque type d'événement avait sa propre composante, ou peut-être que certains partageaient la même chose (c.-à-d. Étaient corrélés)?
Je dois mentionner que mon ensemble de données est de l'ordre de 500 000 points , ce qui rend les choses un peu plus difficiles à gérer.
EDIT: Comme indiqué dans les réponses ci-dessous et les commentaires, la voie à suivre consiste à modéliser cela comme un processus ponctuel marqué, puis à utiliser R pour effectuer tous les travaux lourds, comme expliqué en détail dans ce rapport d'atelier: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html