Ah, cette question. Tout d'abord, permettez-moi de dire que je travaille pour une société de validation d'adresses, SmartyStreets, mais je vais essayer d'être objectif.
Les données du géocodage américain proviennent généralement de deux sources de base, gratuites et coûteuses. Allons-y un peu.
Les données de géocodage gratuites proviennent du US Census Bureau. Certains vous diront que cela vient de l'USGS ou même de l'USPS, mais la source racine est le US Census Bureau. Ils ont un ensemble de données assez complet de coordonnées de segment de rue, appelé données TIGER. Les données TIGER peuvent être téléchargées gratuitement (bien qu'il faille BEAUCOUP de manipulations pour les rendre utilisables). L'USPS a tenté de lier les données TIGER et de les mapper aux codes postaux (qui ne sont PAS des frontières géopolitiques mais plutôt des zones de livraison USPS). Il existe de nombreux services différents qui utilisent ces données TIGER comme source de coordonnées géographiques. Ils utilisent différents algorithmes pour déterminer la position d'une adresse le long d'un segment de rue, puis interpolent le géocodage en fonction de cet algorithme. En raison du faible coût des données et des coûts de licence des données source (gratuites), de nombreux services permettront aux clients de stocker les données de géocodage qui font partie des données de sortie. SmartyStreets est l'un de ceux qui croient que vous pouvez faire ce que vous voulez avec les données.
Les données de géocodage non gratuites proviennent d'un certain nombre de sources coûteuses. Ces sources compilent généralement leurs propres données, bien qu'elles augmentent également ces données avec des données sous licence provenant d'autres sources. Vous avez des sources telles que googlemaps, nokia, navteq, bing maps, yahoo, mapquest ... (Oui, je sais, certaines appartiennent à d'autres.) Leurs données sont beaucoup plus chères à acquérir et leur licence interdit généralement aux clients de stocker les données de réponse.
Vous disposez donc de données source gratuites et de données source coûteuses. Généralement, ce coût est répercuté sous la forme de licences plus restrictives. J'espère que cela pourra aider.
Voici une courte liste de fournisseurs qui permet de stocker les données de sortie (il y en a certainement plus):
geocod.io smartystreets.com yaddress.net
Soit dit en passant, c'est moi qui ai créé le tableau auquel il était fait référence dans le message d'origine. Je travaille avec des données d'adresse toute la journée chez SmartyStreets.
--update-- @zsero En fait, je crois que des données similaires à celles disponibles auprès du US Census Bureau sont disponibles dans un certain nombre de pays. L'Australie, par exemple, donc j'ai entendu. Cependant, ce n'est pas nécessairement le pays d'où proviennent les données mais plutôt le niveau de précision. Les données du US Census Bureau, par exemple, fournissent des coordonnées géographiques assez précises pour les segments de rue, mais pas pour les adresses. L'interpolation d'adresse à partir de ce segment de rue (point de départ ou d'arrivée de la rue) le long du fichier de formes qui désigne la forme de la rue permet de «deviner» où l'adresse pourrait se trouver le long de la rue. C'est assez bon pour l'analyse statistique. Cependant, pour quelque chose comme le parachutisme de précision ou une frappe de missile chirurgical, cela ne serait pas suffisant. Vous souhaitez des données de géocodage au niveau du toit. TypiquementC'EST la différence entre les données gratuites et chères.