La programmation utf-8

5

Quelle est la bonne façon d'encoder les caractères Unicode par URL?

Je connais le schéma non standard% uxxxx mais cela ne semble pas être un choix judicieux puisque le schéma a été rejeté par le W3C. Quelques exemples intéressants: Le caractère du cœur. Si je tape ceci dans mon navigateur: http://www.google.com/search?q=♥ Puis copiez et collez-le, je vois cette URL http://www.google.com/search?q=%E2%99%A5 ce …

107 unicode utf-8 character-encoding urlencode web-standards

10

UnicodeDecodeError: le codec 'ascii' ne peut pas décoder l'octet 0xd1 en position 2: ordinal pas dans la plage (128)

J'essaie de travailler avec un très grand ensemble de données contenant des caractères non standard. Je dois utiliser unicode, conformément aux spécifications du travail, mais je suis déconcerté. (Et très probablement tout faire mal.) J'ouvre le CSV en utilisant: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Ensuite, j'essaye de l'encoder …

107 python django utf-8

16

UnicodeDecodeError: le codec 'ascii' ne peut pas décoder l'octet 0xef en position 1

J'ai quelques problèmes en essayant d'encoder une chaîne en UTF-8. J'ai essayé de nombreuses choses, y compris l'utilisation de string.encode('utf-8')et unicode(string), mais j'obtiens l'erreur: UnicodeDecodeError: le codec 'ascii' ne peut pas décoder l'octet 0xef en position 1: l'ordinal n'est pas dans la plage (128) Ceci est ma chaîne: (｡･ω･｡)ﾉ Je …

106 python unicode utf-8

9

L'utilisation de l'atob de Javascript pour décoder base64 ne décode pas correctement les chaînes utf-8

J'utilise la window.atob()fonction Javascript pour décoder une chaîne encodée en base64 (en particulier le contenu encodé en base64 de l'API GitHub). Le problème est que je récupère les caractères encodés en ASCII (comme â¢au lieu de ™). Comment puis-je gérer correctement le flux entrant encodé en base64 pour qu'il soit …

106 javascript encoding utf-8

2

Modification de l'encodage de sortie par défaut de PowerShell en UTF-8

Par défaut, lorsque vous redirigez la sortie d'une commande vers un fichier ou que vous la dirigez vers quelque chose d'autre dans PowerShell, l'encodage est UTF-16, ce qui n'est pas utile. Je cherche à le changer en UTF-8. Cela peut être fait au cas par cas en remplaçant la >foo.txtsyntaxe …

105 powershell utf-8 character-encoding

8

C # Convertir la chaîne de UTF-8 en ISO-8859-1 (Latin1) H

J'ai cherché sur Google ce sujet et j'ai examiné toutes les réponses, mais je ne comprends toujours pas. Fondamentalement, je dois convertir la chaîne UTF-8 en ISO-8859-1 et je le fais en utilisant le code suivant: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); Ma chaîne …

103 c# .net encoding utf-8 iso-8859-1

14

Comment faire en sorte que MySQL gère correctement UTF-8

L'une des réponses à une question que j'ai posée hier m'a suggéré de m'assurer que ma base de données peut gérer correctement les caractères UTF-8. Comment puis-je faire cela avec MySQL?

102 mysql utf-8

4

Comment utiliser les symboles grecs dans ggplot2?

Mes catégories doivent être nommées avec des lettres grecques. J'utilise ggplot2et cela fonctionne à merveille avec les données. Malheureusement, je ne peux pas comprendre comment mettre ces symboles grecs sur l'axe des x (au niveau des graduations) et les faire également apparaître dans la légende. Y a-t-il un moyen de …

101 r graphics unicode utf-8 ggplot2

6

Utilisation de StringWriter pour la sérialisation XML

Je recherche actuellement un moyen simple de sérialiser des objets (en C # 3). J'ai googlé quelques exemples et suis venu avec quelque chose comme: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 …

99 c# sql-server xml utf-8 xml-serialization

7

Comment décoder les séquences d'échappement Unicode telles que «\ u00ed» en caractères codés UTF-8 appropriés?

Existe-t-il une fonction en PHP qui peut décoder des séquences d'échappement Unicode comme " \u00ed" to " í" et toutes les autres occurrences similaires? J'ai trouvé une question similaire ici mais cela ne semble pas fonctionner.

97 php unicode utf-8 escaping decoding

10

Combien de caractères peut encoder UTF-8?

Si UTF-8 est de 8 bits, cela ne signifie-t-il pas qu'il ne peut y avoir que 256 caractères différents au maximum? Les 128 premiers points de code sont les mêmes qu'en ASCII. Mais il dit que UTF-8 peut prendre en charge jusqu'à un million de caractères? Comment cela marche-t-il?

97 utf-8 character-encoding ascii

5

Exemple de chaîne utf8 invalide?

Je teste comment une partie de mon code gère les mauvaises données, et j'ai besoin de quelques séries d'octets UTF-8 invalides. Pouvez-vous en publier, et idéalement, une explication de la raison pour laquelle ils sont mauvais / où vous les avez obtenus?

96 unit-testing utf-8

3

Lecture d'InputStream en UTF-8

J'essaie de lire un text/plainfichier sur Internet, ligne par ligne. Le code que j'ai en ce moment est: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line : lines) …

96 java utf-8 inputstream

11

Un moyen élégant de rechercher des fichiers UTF-8 avec BOM?

À des fins de débogage, je dois rechercher de manière récursive dans un répertoire tous les fichiers commençant par une marque d'ordre d'octet (BOM) UTF-8. Ma solution actuelle est un simple script shell: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' …

94 php utf-8 shell text-editor

9

Lire un fichier CSV UTF8 avec Python

J'essaie de lire un fichier CSV avec des caractères accentués avec Python (uniquement des caractères français et / ou espagnols). Basé sur la documentation Python 2.5 pour le csvreader ( http://docs.python.org/library/csv.html ), j'ai proposé le code suivant pour lire le fichier CSV car le csvreader ne prend en charge que …

93 python utf-8 csv character-encoding

Questions marquées «utf-8»