J'ai des ensembles de données qui contiennent, parmi de nombreuses fonctionnalités, des coordonnées GPS (latitude et longitude). Je voudrais utiliser ces ensembles de données pour explorer des problèmes tels que: (1) calculer l'ETA pour conduire entre les points de début et de fin; et (2) estimer le degré de criminalité pour un point spécifique.
Je voudrais utiliser un modèle de régression linéaire. Cependant, puis-je utiliser ces coordonnées GPS directement dans un modèle linéaire?
La latitude et la longitude n'ont pas de propriété ordinale , comme avec l'âge d'une personne. Par exemple, les deux points (40.805996, -96.681473) et (41.226682, -95.986587) ne semblent pas avoir de classement significatif. Ce ne sont que des points dans l'espace. Je pensais à les remplacer par des codes postaux américains catégoriques, puis à faire un codage à chaud , mais cela entraînerait de nombreuses variables.