UTF-8 est un codage de caractères qui décrit chaque point de code Unicode à l'aide d'une séquence d'octets de un à quatre octets. Il est rétrocompatible avec ASCII tout en prenant en charge la représentation de tous les points de code Unicode.
Je connais le schéma non standard% uxxxx mais cela ne semble pas être un choix judicieux puisque le schéma a été rejeté par le W3C. Quelques exemples intéressants: Le caractère du cœur. Si je tape ceci dans mon navigateur: http://www.google.com/search?q=♥ Puis copiez et collez-le, je vois cette URL http://www.google.com/search?q=%E2%99%A5 ce …
J'essaie de travailler avec un très grand ensemble de données contenant des caractères non standard. Je dois utiliser unicode, conformément aux spécifications du travail, mais je suis déconcerté. (Et très probablement tout faire mal.) J'ouvre le CSV en utilisant: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Ensuite, j'essaye de l'encoder …
J'ai quelques problèmes en essayant d'encoder une chaîne en UTF-8. J'ai essayé de nombreuses choses, y compris l'utilisation de string.encode('utf-8')et unicode(string), mais j'obtiens l'erreur: UnicodeDecodeError: le codec 'ascii' ne peut pas décoder l'octet 0xef en position 1: l'ordinal n'est pas dans la plage (128) Ceci est ma chaîne: (。・ω・。)ノ Je …
J'utilise la window.atob()fonction Javascript pour décoder une chaîne encodée en base64 (en particulier le contenu encodé en base64 de l'API GitHub). Le problème est que je récupère les caractères encodés en ASCII (comme â¢au lieu de ™). Comment puis-je gérer correctement le flux entrant encodé en base64 pour qu'il soit …
Par défaut, lorsque vous redirigez la sortie d'une commande vers un fichier ou que vous la dirigez vers quelque chose d'autre dans PowerShell, l'encodage est UTF-16, ce qui n'est pas utile. Je cherche à le changer en UTF-8. Cela peut être fait au cas par cas en remplaçant la >foo.txtsyntaxe …
J'ai cherché sur Google ce sujet et j'ai examiné toutes les réponses, mais je ne comprends toujours pas. Fondamentalement, je dois convertir la chaîne UTF-8 en ISO-8859-1 et je le fais en utilisant le code suivant: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); Ma chaîne …
L'une des réponses à une question que j'ai posée hier m'a suggéré de m'assurer que ma base de données peut gérer correctement les caractères UTF-8. Comment puis-je faire cela avec MySQL?
Mes catégories doivent être nommées avec des lettres grecques. J'utilise ggplot2et cela fonctionne à merveille avec les données. Malheureusement, je ne peux pas comprendre comment mettre ces symboles grecs sur l'axe des x (au niveau des graduations) et les faire également apparaître dans la légende. Y a-t-il un moyen de …
Je recherche actuellement un moyen simple de sérialiser des objets (en C # 3). J'ai googlé quelques exemples et suis venu avec quelque chose comme: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 …
Existe-t-il une fonction en PHP qui peut décoder des séquences d'échappement Unicode comme " \u00ed" to " í" et toutes les autres occurrences similaires? J'ai trouvé une question similaire ici mais cela ne semble pas fonctionner.
Si UTF-8 est de 8 bits, cela ne signifie-t-il pas qu'il ne peut y avoir que 256 caractères différents au maximum? Les 128 premiers points de code sont les mêmes qu'en ASCII. Mais il dit que UTF-8 peut prendre en charge jusqu'à un million de caractères? Comment cela marche-t-il?
Je teste comment une partie de mon code gère les mauvaises données, et j'ai besoin de quelques séries d'octets UTF-8 invalides. Pouvez-vous en publier, et idéalement, une explication de la raison pour laquelle ils sont mauvais / où vous les avez obtenus?
J'essaie de lire un text/plainfichier sur Internet, ligne par ligne. Le code que j'ai en ce moment est: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line : lines) …
À des fins de débogage, je dois rechercher de manière récursive dans un répertoire tous les fichiers commençant par une marque d'ordre d'octet (BOM) UTF-8. Ma solution actuelle est un simple script shell: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' …
J'essaie de lire un fichier CSV avec des caractères accentués avec Python (uniquement des caractères français et / ou espagnols). Basé sur la documentation Python 2.5 pour le csvreader ( http://docs.python.org/library/csv.html ), j'ai proposé le code suivant pour lire le fichier CSV car le csvreader ne prend en charge que …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.