UTF-8 est un codage de caractères qui décrit chaque point de code Unicode à l'aide d'une séquence d'octets de un à quatre octets. Il est rétrocompatible avec ASCII tout en prenant en charge la représentation de tous les points de code Unicode.
J'ai des problèmes de cerveau dans la compréhension de la lecture et de l'écriture de texte dans un fichier (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print …
Je lis beaucoup de textes de divers flux RSS et je les insère dans ma base de données. Bien sûr, plusieurs codages de caractères différents sont utilisés dans les flux, par exemple UTF-8 et ISO 8859-1. Malheureusement, il y a parfois des problèmes avec les encodages des textes. Exemple: Le …
J'essaie de comprendre quel classement je devrais utiliser pour différents types de données. 100% du contenu que je vais stocker est soumis par l'utilisateur. Ma compréhension est que je devrais utiliser UTF-8 General CI (insensible à la casse) au lieu de UTF-8 Binary. Cependant, je ne trouve pas de distinction …
J'ai besoin d'utiliser UTF-8 dans mes propriétés de ressource en utilisant Java ResourceBundle. Lorsque j'entre le texte directement dans le fichier de propriétés, il s'affiche sous forme de mojibake. Mon application s'exécute sur Google App Engine. Quelqu'un peut-il me donner un exemple? Je ne peux pas obtenir ce travail.
Out-File semble forcer la nomenclature lors de l'utilisation de l'UTF-8: $MyFile = Get-Content $MyPath $MyFile | Out-File -Encoding "UTF8" $MyPath Comment puis-je écrire un fichier en UTF-8 sans nomenclature à l'aide de PowerShell?
J'ai passé beaucoup de temps en tant que débutant en Python. Comment pourrais-je jamais décoder une telle URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 à celui-ci en python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) renvoie quelque chose de très laid. Toujours pas de solution, toute aide est appréciée.
Supposons que je viens d'utiliser un BufferedInputStreampour lire les octets d'un fichier texte encodé UTF-8 dans un tableau d'octets. Je sais que je peux utiliser la routine suivante pour convertir les octets en chaîne, mais y a-t-il un moyen plus efficace / plus intelligent de faire cela que de simplement …
Voici comment ma connexion est établie: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); Et j'obtiens l'erreur suivante lorsque je tente d'ajouter une ligne à une table: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 J'insère des milliers d'enregistrements et j'obtiens toujours cette erreur lorsque le …
J'utilise un &symbole ' ' avec HTML5 et UTF-8 dans mon site <title>. Google montre l'esperluette fine sur ses SERPs, comme le font tous les navigateurs dans leurs titres. http://validator.w3.org me donne ceci: & n'a pas commencé de référence de caractère. (& aurait probablement dû être échappé comme &amp;.) Dois-je …
Je suis vraiment confus avec le codecs.open function. Quand je fais: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Ça me donne l'erreur UnicodeDecodeError: le codec 'ascii' ne peut pas décoder l'octet 0xef en position 0: l'ordinal n'est pas dans la plage (128) Si je fais: file = open("temp", "w") file.write(codecs.BOM_UTF8) …
J'ai une application héritée qui commence à mal se comporter, pour une raison que je ne suis pas sûre. Il génère un tas de code HTML qui est transformé en rapports PDF par ActivePDF. Le processus fonctionne comme ceci: Extraire un modèle HTML d'une base de données contenant des jetons …
J'essaie d'analyser du HTML en utilisant DOMDocument, mais quand je le fais, je perds soudainement mon encodage (du moins c'est ainsi qu'il me semble). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Le résultat de ce code …
J'ai un navigateur qui envoie des caractères utf-8 à mon serveur Python, mais lorsque je le récupère à partir de la chaîne de requête, l'encodage renvoyé par Python est ASCII. Comment puis-je convertir la chaîne simple en utf-8? REMARQUE: La chaîne transmise depuis le Web est déjà encodée en UTF-8, …
J'ai ce truc très simple qui sort juste des trucs au format CSV, mais ça doit être UTF-8. J'ouvre ce fichier dans TextEdit ou TextMate ou Dreamweaver et il affiche correctement les caractères UTF-8, mais si je l'ouvre dans Excel, c'est ce genre de chose stupide à la place. Voici …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.