Existe-t-il un moyen de déterminer le jeu de caractères utilisé pour un fichier de formes donné?
Existe-t-il un moyen de déterminer le jeu de caractères utilisé pour un fichier de formes donné?
Réponses:
Essai et erreur. Essayez d'ouvrir le fichier .dbf avec Ms Excel ou avec OpenOffice en utilisant des paramètres différents jusqu'à ce que tout soit correct.
Regardez cet article pour plus d'indices: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Les programmes peuvent déterminer le jeu de caractères d'un fichier de formes de deux manières.
L' fileutilitaire est capable de deviner l'encodage d'un fichier texte. À utiliser ogr2ogrpour une conversion qui préserve l'encodage d'origine s'il n'y a pas de .cpgfichier :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Exemple de sortie:
file.csv: ISO-8859 text
Je l'ai testé avec deux des encodages les plus fréquents, UTF-8 et latin1. Fonctionne prêt à l'emploi dans Ubuntu, je ne suis pas sûr d'OS X. Je ne connais pas d' fileutilitaire sous Windows.
REMARQUE : dès qu'il y a un .cpgfichier correspondant qui indique l'encodage, ogr2ogrl'honorera et la sortie sera en UTF-8. Mais si la sortie CSV semble correcte, vous savez que les informations contenues dans le .cpgfichier sont exactes.
Une autre table pour convertir le 29e octet de * .dbf en page de codes: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm