Questions marquées «unicode»

Unicode est une norme pour l'encodage, la représentation et la manipulation de texte avec l'intention de prendre en charge tous les caractères requis pour un texte écrit incorporant tous les systèmes d'écriture, symboles techniques et ponctuation.





12
UTF-8, UTF-16 et UTF-32
Quelles sont les différences entre UTF-8, UTF-16 et UTF-32? Je comprends qu'ils stockeront tous Unicode et que chacun utilise un nombre différent d'octets pour représenter un caractère. Y a-t-il un avantage à choisir l'un plutôt que l'autre?
487 unicode  utf-8  utf-16  utf  utf-32 

12
Sauvegarde des textes utf-8 dans json.dumps en UTF8, pas en tant que séquence d'échappement \ u
exemple de code: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Le problème: ce n'est pas lisible par l'homme. Mes utilisateurs (intelligents) veulent vérifier ou même modifier des fichiers texte avec des vidages JSON (et je préfère ne pas utiliser XML). Existe-t-il un moyen de …
474 python  json  unicode  utf-8  escaping 

30
Meilleure façon d'inverser une chaîne
Je viens d'avoir à écrire une fonction de chaîne inversée en C # 2.0 (c'est-à-dire LINQ non disponible) et j'ai trouvé ceci: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; …

18
UnicodeDecodeError lors de la lecture d'un fichier CSV dans Pandas avec Python
J'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent cette erreur ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …


9
Qu'est-ce que Unicode, UTF-8, UTF-16?
Quelle est la base d'Unicode et pourquoi le besoin d'UTF-8 ou UTF-16? J'ai fait des recherches sur Google et cherché ici aussi, mais ce n'est pas clair pour moi. Dans VSS lors de la comparaison de fichiers, il y a parfois un message indiquant que les deux fichiers ont des …

5
Pourquoi 2+ 40 est égal à 42?
J'ai été déconcerté lorsqu'un collègue m'a montré cette ligne d'alerte JavaScript 42. alert(2+ 40); Exécuter l'extrait de codeMasquer les résultatsDévelopper l'extrait Il s'avère rapidement que ce qui ressemble à un signe moins est en fait un caractère Unicode obscur avec une sémantique clairement différente. Cela m'a laissé me demander pourquoi …

11
Comment est-ce que je grep pour tous les caractères non-ASCII?
J'ai plusieurs fichiers XML très volumineux et j'essaie de trouver les lignes qui contiennent des caractères non ASCII. J'ai essayé ce qui suit: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Mais cela renvoie toutes les lignes du fichier, que la ligne contienne ou non un caractère dans la plage spécifiée. La syntaxe est-elle …
359 regex  unix  unicode  grep 


6
Comment trouver la longueur d'une chaîne en R
Comment trouver la longueur d'une chaîne (nombre de caractères dans une chaîne) sans la diviser en R? Je sais trouver la longueur d'une liste mais pas d'une chaîne. Et qu'en est-il des chaînes Unicode? Comment trouver la longueur (en octets) et le nombre de caractères (runes, symboles) dans une chaîne …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.