Qualité du géocodage: Nominatim vs. PostGIS Geocoder vs. Geocoder :: US 2.0


14

J'ai parfois besoin de géocoder >> 500 000 adresses de rue aux États-Unis (sans caractéristiques ni intersections). J'aimerais mettre en place un service de géocodage localement pour gérer ces géocodes en vrac.

J'ai utilisé localement Geocoder :: US 2.0 basé sur Tiger . L'analyse comparative initiale donne une précision raisonnable par rapport aux adresses géocodées par Google, en particulier lorsque je ne me fie pas à l'analyseur Ruby et que je transmets les éléments d'adresse au géocodeur de manière explicite.

J'ai également lu beaucoup de choses sur le géocodeur PostGIS . Étant donné que mes données sont déjà dans PostGIS, cela semble attrayant, mais je ne l'ai pas configuré localement pour l'essayer.

De plus, quelqu'un m'a recommandé d'essayer Nominatim localement. Je ne sais pas grand-chose à ce sujet, sauf qu'il n'est pas basé sur Tiger (pour autant que je sache), et je me demande si j'obtiendrai des résultats plus fiables.

Ma question à toute personne expérimentée avec les solutions ci-dessus: comment la précision des trois se compare-t-elle? Plus précisément, qui fournit les géocodages les plus fiables pour les adresses aux États-Unis? Je ne suis pas trop préoccupé par la vitesse ou la complexité de la configuration.

Réponses:


14

Je n'ai pas eu l'occasion de tester les géocodeurs Nominatim et Geocoder US. Ma compréhension est que le Geocoder et Nominatim ne peuvent pas être exécutés directement dans la base de données, ce qui pour moi est un gros inconvénient car cela les rend difficiles à utiliser dans des choses comme les déclencheurs ou pour les mises à jour par lots directement dans la base de données.

Le géocodeur PostGIS étant un pur ensemble PostGIS / postgresql de fonctions plpgsql, s'exécute complètement dans la base de données. Je m'attendrais à ce que les résultats du géocodeur Geocoder US et PostGIS soient comparables et de ce que j'ai testé en utilisant les trucs Web, ils le sont. Google est un peu mieux car ils profitent des noms de lieux.

Je pense que Nominatum, car il utilise des données OSM, utilise des données de tigre indirectement, car OSM importe pour les États-Unis une grande partie de cela provient de TIGER avec des corrections apportées par les utilisateurs. Je ne sais pas quel millésime (année) de Tiger OSM est actuellement. En jouant avec les interfaces Web en ligne, il tire également parti des noms de lieux et présente une touche intéressante en ce sens qu'il vous permet de spécifier le niveau de zoom du géocodage, ce qui permet un géocodage plus rapide en définissant la précision de zoom dont vous avez besoin.

Divulgation complète - J'ai fait beaucoup de travail sur PostGIS Geocoder et j'ai écrit le manuel en ligne pour cela. Je vais vous dire qu'un bug sur lequel je travaille est que je pense que l'emplacement du point qu'il interpole est du mauvais côté de la rue. Je travaille sur la correction de cela. Si vous ne vous souciez pas de quel côté de la rue (ou du moins parfois), cela peut ne pas vous poser de problème.

Il vaut probablement la peine de tester avec les versions en ligne en comparant certains résultats d'adresse: par exemple nominatim, vous pouvez tester ici: http://open.mapquestapi.com/nominatim/v1/search.php

Pour mes cas d'utilisation, j'ai trouvé que la vérification floue de nominatum n'est pas aussi bonne que celle de PostGIS Geocoder. Par exemple, mon adresse de vanité (adresse postale) est 1 Devonshire Place, Boston MA. PostGIS renvoie une réponse qui est proche si je me souviens bien, Google renvoie une réponse, mais je ne peux pas demander à Nominatim de renvoyer une réponse. Pour être juste, même les dossiers de colis de Boston n'ont aucune idée de l'endroit où ils se trouvent et sont répertoriés dans les dossiers de colis comme Washington Street. PostGIS peut le trouver car il effectue différents niveaux de vérification et d'intersections de rues transversales, etc. Google aussi.



Merci pour la réponse! Je ferai des analyses comparatives au cours de la semaine prochaine, mais j'ai été impressionné par le codeur PostGIS Tiger jusqu'à présent.
danpelota

À l'exception du raccrochage occasionnel pour un débutant, bien sûr: postgis.refractions.net/pipermail/postgis-users/2011-March/…
danpelota

tigergeocoder.com utilisant les données TIGER 2013, prêt à exécuter votre propre instance de serveur dans le cloud Amazon EC2 et géocoder 1 000 000+ par jour. PostGIS, comme vous l'avez mentionné, a également chargé les quartiers Zillow et renvoie les codes FIPS pour les parties d'adresse. API REST similaire à Google mais avec votre propre serveur, aucun quota requis.
Biba

Nominatim fonctionne rapidement et a tendance à être plus précis en 2019, avant les nouvelles données du tigre. Il n'évalue pas les zones et la devinette de l'adresse est juste meilleure.
Andrew Scott Evans

-1

Techniquement, vous pouvez empiler les bases de données Tiger et OSM sur un seul serveur géant et les créer dans Nominatum OSM. Tiger peut être importé facilement et il complète le serveur OSM.

Qui que ce soit, la qualité des données que vous récupérerez ne sera pas sur le toit. OSM manque de précision pour les adresses aux États-Unis. À certaines occasions, je l'ai vu jusqu'à 90 milles de la cible d'origine.

La base de données Tiger n'est pas non plus précise en raison de l'algorithme d'interpolation qui lui est attribué afin de prédire les emplacements des numéros de rue. En général, ils compenseront l'objectif réel de 300 pieds à quelques milles.

Je pense que vous devez évaluer le temps et les ressources d'hébergement si vous construisez votre propre géocodeur par rapport à un commercial. Avec un commercial, vous obtiendrez des emplacements sur les toits et ne vous inquiétez de rien. Les prix pour 500k seront d'environ 600 $ à 800 $ avec différents fournisseurs.


2
Quel rapport avez-vous avec votre entreprise? Il semble que vous incluez une signature avec un lien vers votre site Web sous la forme, dans ce cas, d'une clause de non-responsabilité inutile, et donc je la modifie. Dans tous les cas, veuillez ne pas inclure de lien dans toute clause de non-responsabilité.
PolyGeo
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.