Quelle est la façon la plus simple de réaliser un géocodage de masse unique? (580 000 adresses américaines)


13

Je travaille sur un projet lié à l'éducation civique et je dois être en mesure d'afficher toutes les propriétés de la ville de Philadelphie sur une carte, donc je devrai obtenir la latitude et la longitude pour les 580 000 propriétés. (Juste une fois)

La plupart des API comme Google / Yahoo ont des limites de 5 000 par jour, et même BatchGeo a une limite similaire.

Existe-t-il un moyen de géocoder une seule fois toutes ces adresses?


4
Le moyen le plus simple est de trouver un bon fournisseur commercial.
Matthew Snape

1
Aimez votre nom d'utilisateur!
nmpeterson

Réponses:


14

Vous pouvez essayer l' outil Street Address to Coordinates de la Data Science Toolkit.

This API takes either a single string representing a postal address, or a JSON-encoded  
array of addresses, and returns a JSON object with a key for every address. The value 
for each key is either null if no information was found for the address, or an object 
containing location information, including country, region, city and latitude/longitude 
coordinates. Here's an example:

Vous ne savez pas quelles sont les limites de l'API pour la copie hébergée de Pete Warden, mais vous pouvez exécuter la boîte à outils vous-même et effectuer votre traitement hors ligne comme le suggère @Devdatta. Il existe une machine virtuelle téléchargeable qui contient tous les outils du site Web. Bonne chance :)


Grand merci! Je vais l'essayer et vous faire savoir si cela a fonctionné.
Tobias Fünke

Cela fonctionne très bien jusqu'à présent! J'exécute la machine virtuelle donc j'espère qu'il n'y a pas de limites. Tirent-ils d'une base de données locale ou vérifient-ils une API Web?
Tobias Fünke

1
La VM utilise est livrée avec une base de données de lieux, alors oui, pas de limites. La couverture est excellente pour les États-Unis si je ne me trompe pas. Vous pouvez jouer avec la source si vous êtes intéressé :) github.com/petewarden/dstk et github.com/petewarden/dstkdata
RK

1
Cela a pris huit jours
Tobias Fünke

1
Merci pour cette référence @RK Je me demande pourquoi datasciencetoolkit n'est pas plus populaire. Ils ne sont pas venus dans mes recherches ces derniers jours, ont dû creuser plus profondément. À votre santé!
dchhetri

3

Avec cette quantité de données, je vous suggère de faire un géocodage hors ligne. Seules les requêtes http pour ces nombreux enregistrements seraient classées comme une attaque DoS par n'importe quel serveur.


4
Pas tout à fait vrai. Si vous utilisez un service conçu pour gérer autant de demandes de géocodage, ce ne sera pas un problème. L'API LiveAddress peut facilement gérer 1 000 demandes d'adresse par seconde. Cela éliminerait 598k en environ 10 minutes. (Je travaille à la vérification d'adresse et au géocodage toute la journée - je travaille chez SmartyStreets)
Jeffrey

3

Le géocodage se traduira par des points - 580 000 d'entre eux. Voulez-vous vraiment les afficher tous sur une carte? Tant de points groupés rendront probablement la carte illisible. Ces problèmes supposent que vous trouviez un moyen de géocoder autant d'enregistrements.

Les enregistrements de parcelles de la ville de Philadelphie sont disponibles sous forme de couche polygonale. De plus, ces polygones sont déjà disponibles en tant que service de carte. Si les données / services conviennent à vos besoins, vous n'avez pas à vous soucier du géocodage de tant de points, et les polygones seront probablement plus beaux que tant de points sur la carte.

Informations sur les données (y compris les métadonnées et le téléchargement) et le service de carte:

http://www.pasda.psu.edu/uci/MapService.aspx?Dataset=462

Aperçu du service de carte (zoom avant pour une meilleure vue)

http://maps.psiee.psu.edu/preview/map.ashx?layer=462



2

Vous pouvez essayer Geocoda: https://geocoda.com pour une API JSON. Geocoda dispose d'une API qui vous permet d'obtenir une lat / lon pour une adresse qui convient à vos besoins. Geocoda n'a pas de limite de requête quotidienne, mais a une limite de compte initiale de 10 requêtes par seconde.

Avertissement: je travaille chez Geocoda. Faites-moi savoir si vous souhaitez obtenir de l'aide pour démarrer ou si vous souhaitez prévisualiser notre API de traitement par lots.


1

Vous pouvez essayer SVB Mapper qui est téléchargeable à partir d' ici et fonctionne très bien avec Excel et Bing Maps. Vous pouvez exécuter le mappage et l'analyse directement dans Excel. Vous devrez peut-être vérifier le quota et les limites.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.