Questions marquées «character-encoding»

Le codage des caractères fait référence à la manière dont les caractères sont représentés sous forme de série d'octets. Le codage des caractères pour le Web est défini dans la norme d'encodage.

6
Le code ASCII est-il 7 bits ou 8 bits?
Mon professeur m'a dit que l'ASCII était un schéma de codage de caractères 8 bits. Mais il n'est défini que pour les codes 0-127, ce qui signifie qu'il peut être ajusté sur 7 bits. Alors ne peut-on pas prétendre que le bit ASCII est en fait du code 7 bits? …



10
Combien de caractères peut encoder UTF-8?
Si UTF-8 est de 8 bits, cela ne signifie-t-il pas qu'il ne peut y avoir que 256 caractères différents au maximum? Les 128 premiers points de code sont les mêmes qu'en ASCII. Mais il dit que UTF-8 peut prendre en charge jusqu'à un million de caractères? Comment cela marche-t-il?


3
JsonParseException: caractère illégal non entre guillemets ((CTRL-CHAR, code 10)
J'essaie d'utiliser org.apache.httpcomponentspour consommer une API Rest, qui publiera des données au format JSON sur l'API. J'obtiens cette exception: Causé par: com.fasterxml.jackson.core.JsonParseException: Caractère illégal sans guillemets ((CTRL-CHAR, code 10)): doit être échappé en utilisant une barre oblique inverse pour être inclus dans la chaîne. La raison en est que ctrl-charest …


9
Lire un fichier CSV UTF8 avec Python
J'essaie de lire un fichier CSV avec des caractères accentués avec Python (uniquement des caractères français et / ou espagnols). Basé sur la documentation Python 2.5 pour le csvreader ( http://docs.python.org/library/csv.html ), j'ai proposé le code suivant pour lire le fichier CSV car le csvreader ne prend en charge que …

10
Charset tout compris pour éviter «java.nio.charset.MalformedInputException: Input length = 1»?
Je crée un programme de comptage de mots simple en Java qui lit les fichiers texte d'un répertoire. Cependant, je continue à recevoir l'erreur: java.nio.charset.MalformedInputException: Input length = 1 à partir de cette ligne de code: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Je sais que j'obtiens probablement cela parce que j'ai utilisé …



5
Python: Conversion d'ISO-8859-1 / latin1 en UTF-8
J'ai cette chaîne qui a été décodée de Quoted-printable à ISO-8859-1 avec le module email. Cela me donne des chaînes comme "\ xC4pple" qui correspondraient à "Äpple" (Apple en suédois). Cependant, je ne peux pas convertir ces chaînes en UTF-8. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback …



En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.