Je construis actuellement une instance sur EC2 sur laquelle importer l'intégralité de l'instantané Planet.osm de la valeur de la Terre entière pour certains projets sur lesquels nous travaillons. J'ai créé une grande instance Ubuntu x64 et attaché beaucoup de stockage séparé sur un volume EBS pour la base de données Postgres et l'ai modifié pour y héberger les données PGSQL.
Maintenant, le serveur a du mal à utiliser osm2pgsql
pour importer l'instantané ... Après quelques tentatives avec différentes configurations de mémoire et ainsi de suite, le processus continue de produire "Killed" après avoir parcouru presque tout le chemin; une fois qu'il a été tué en "parcourant les voies en attente" et la prochaine fois, après avoir légèrement ajusté le cache mince, il a atteint les "voies de traitement" avant de s'écraser. D'après ce que j'ai lu, cela est généralement dû à des problèmes de mémoire.
Voici ma dernière tentative d'exécuter l'importation:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
Et voici les spécifications d'une grande instance sur EC2:
Grande instance 7,5 Go de mémoire, 4 unités de calcul EC2 (2 cœurs virtuels avec 2 unités de calcul EC2 chacune), 850 Go de stockage d'instance locale, plate-forme 64 bits
Ma question est - existe-t-il de bonnes ressources de référence pour déterminer les exigences de réglage pour osm2pgsql et Postgres? Vitesse d'importation est même pas important pour moi, je voudrais simplement être en mesure de vous assurer que le processus se termine en toute sécurité, même si cela prend 4 ou 5 jours ... Je l' ai lu "de Frederick Ramm Optimisation du rendu chaîne "(PDF) du SOTM de l'an dernier, mais existe-t-il d'autres bonnes opinions / ressources?