Existe-t-il un moyen de déterminer le jeu de caractères utilisé pour un fichier de formes donné?
Existe-t-il un moyen de déterminer le jeu de caractères utilisé pour un fichier de formes donné?
Réponses:
Essai et erreur. Essayez d'ouvrir le fichier .dbf avec Ms Excel ou avec OpenOffice en utilisant des paramètres différents jusqu'à ce que tout soit correct.
Regardez cet article pour plus d'indices: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Les programmes peuvent déterminer le jeu de caractères d'un fichier de formes de deux manières.
L' file
utilitaire est capable de deviner l'encodage d'un fichier texte. À utiliser ogr2ogr
pour une conversion qui préserve l'encodage d'origine s'il n'y a pas de .cpg
fichier :
ogr2ogr -f CSV file.csv file.dbf
file file.csv
Exemple de sortie:
file.csv: ISO-8859 text
Je l'ai testé avec deux des encodages les plus fréquents, UTF-8 et latin1. Fonctionne prêt à l'emploi dans Ubuntu, je ne suis pas sûr d'OS X. Je ne connais pas d' file
utilitaire sous Windows.
REMARQUE : dès qu'il y a un .cpg
fichier correspondant qui indique l'encodage, ogr2ogr
l'honorera et la sortie sera en UTF-8. Mais si la sortie CSV semble correcte, vous savez que les informations contenues dans le .cpg
fichier sont exactes.
Une autre table pour convertir le 29e octet de * .dbf en page de codes: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm