La programmation character-encoding

6

Mon professeur m'a dit que l'ASCII était un schéma de codage de caractères 8 bits. Mais il n'est défini que pour les codes 0-127, ce qui signifie qu'il peut être ajusté sur 7 bits. Alors ne peut-on pas prétendre que le bit ASCII est en fait du code 7 bits? …

101 character-encoding ascii

7

Comment deviner de manière fiable l'encodage entre MacRoman, CP1252, Latin1, UTF-8 et ASCII

Au travail, il semble qu'aucune semaine ne passe sans une conniption, une calamité ou une catastrophe liées à l'encodage. Le problème vient généralement des programmeurs qui pensent pouvoir traiter de manière fiable un fichier «texte» sans spécifier l'encodage. Mais tu ne peux pas. Il a donc été décidé d'interdire désormais …

99 java python perl macos character-encoding

4

Comment définir le codage standard dans Visual Studio

Je recherche un moyen de configurer Visual Studio pour qu'il enregistre toujours mes fichiers en UTF-8. Je n'ai trouvé que des options pour définir ce projet à l'échelle. Existe-t-il un moyen de le définir à l'échelle de Visual Studio?

99 visual-studio visual-studio-2008 encoding character-encoding

10

Combien de caractères peut encoder UTF-8?

Si UTF-8 est de 8 bits, cela ne signifie-t-il pas qu'il ne peut y avoir que 256 caractères différents au maximum? Les 128 premiers points de code sont les mêmes qu'en ASCII. Mais il dit que UTF-8 peut prendre en charge jusqu'à un million de caractères? Comment cela marche-t-il?

97 utf-8 character-encoding ascii

3

Est "& # 160;" un remplacement de «& nbsp;»?

Dans mon application ASP.NET, j'essayais d'ajouter quelques espaces blancs entre deux zones de texte en tapant la barre d'espace. La source HTML équivalente était &#160;au lieu de &nbsp;. Alors je voulais juste vérifier: est-ce le nouveau remplacement des espaces blancs? Si oui, une idée de pourquoi ils ont changé?

97 html asp.net visual-studio-2008 character-encoding

3

JsonParseException: caractère illégal non entre guillemets ((CTRL-CHAR, code 10)

J'essaie d'utiliser org.apache.httpcomponentspour consommer une API Rest, qui publiera des données au format JSON sur l'API. J'obtiens cette exception: Causé par: com.fasterxml.jackson.core.JsonParseException: Caractère illégal sans guillemets ((CTRL-CHAR, code 10)): doit être échappé en utilisant une barre oblique inverse pour être inclus dans la chaîne. La raison en est que ctrl-charest …

94 java json character-encoding apache-httpclient-4.x

2

Combien de bits ou d'octets y a-t-il dans un caractère? [fermé]

Il est difficile de dire ce qui est demandé ici. Cette question est ambiguë, vague, incomplète, trop large ou rhétorique et ne peut être raisonnablement répondu dans sa forme actuelle. Pour obtenir de l'aide pour clarifier cette question afin qu'elle puisse être rouverte, visitez le centre d'aide . Fermé il …

94 character-encoding byte

9

Lire un fichier CSV UTF8 avec Python

J'essaie de lire un fichier CSV avec des caractères accentués avec Python (uniquement des caractères français et / ou espagnols). Basé sur la documentation Python 2.5 pour le csvreader ( http://docs.python.org/library/csv.html ), j'ai proposé le code suivant pour lire le fichier CSV car le csvreader ne prend en charge que …

93 python utf-8 csv character-encoding

10

Charset tout compris pour éviter «java.nio.charset.MalformedInputException: Input length = 1»?

Je crée un programme de comptage de mots simple en Java qui lit les fichiers texte d'un répertoire. Cependant, je continue à recevoir l'erreur: java.nio.charset.MalformedInputException: Input length = 1 à partir de cette ligne de code: BufferedReader reader = Files.newBufferedReader(file,Charset.forName("UTF-8")); Je sais que j'obtiens probablement cela parce que j'ai utilisé …

93 java character-encoding

6

Comment trouver le jeu de caractères / encodage par défaut en Java?

La réponse évidente est d'utiliser Charset.defaultCharset()mais nous avons récemment découvert que ce n'était peut-être pas la bonne réponse. On m'a dit que le résultat est différent du jeu de caractères par défaut réel utilisé par les classes java.io à plusieurs reprises. On dirait que Java conserve 2 ensembles de jeux …

92 java encoding character-encoding

6

Problèmes de codage de sortie git log sur l'invite de commande Windows 10

Problème Comment rendre la git logsortie de commande correctement affichée sur l'invite de commande Windows? Exemple Comme vous pouvez le voir, je peux taper correctement les caractères diacritiques, mais git logla sortie est en quelque sorte échappée. Selon le UTF-8tableau de codage, les codes entre crochets ( <et >) de …

88 git character-encoding locale command-prompt

5

Python: Conversion d'ISO-8859-1 / latin1 en UTF-8

J'ai cette chaîne qui a été décodée de Quoted-printable à ISO-8859-1 avec le module email. Cela me donne des chaînes comme "\ xC4pple" qui correspondraient à "Äpple" (Apple en suédois). Cependant, je ne peux pas convertir ces chaînes en UTF-8. >>> apple = "\xC4pple" >>> apple '\xc4pple' >>> apple.encode("UTF-8") Traceback …

87 python character-encoding

13

Enregistrer tous les fichiers du projet Visual Studio au format UTF-8

Je me demande s'il est possible d'enregistrer tous les fichiers d'un projet Visual Studio 2008 dans un encodage de caractères spécifique. J'ai eu une solution avec des encodages mixtes et je veux les rendre tous identiques (UTF-8 avec signature). Je sais comment enregistrer des fichiers uniques, mais qu'en est-il de …

87 visual-studio utf-8 character-encoding

7

Conversion d'un tableau d'octets en chaîne (Java)

J'écris une application Web dans Google App Engine. Il permet aux gens de modifier essentiellement le code html qui est stocké sous forme de .htmlfichier dans le blobstore. J'utilise fetchData pour renvoyer un byte[]de tous les caractères du fichier. J'essaye d'imprimer dans un html pour que l'utilisateur modifie le code …

85 java google-app-engine character-encoding bytearray

4

Existe-t-il un ensemble de fichiers «Lorem ipsums» pour tester les problèmes d'encodage de caractères?

Pour la mise en page, nous avons notre célèbre texte "Lorem ipsum" pour tester à quoi il ressemble. Ce que je recherche, c'est un ensemble de fichiers contenant du texte encodé avec plusieurs encodages différents que je peux utiliser dans mes tests JUnit pour tester certaines méthodes traitant de l'encodage …

85 java unit-testing character-encoding junit

Questions marquées «character-encoding»