La programmation unicode

17

La meilleure façon de convertir des fichiers texte entre des jeux de caractères?

Quel est l'outil ou la méthode la plus rapide et la plus simple pour convertir des fichiers texte entre des jeux de caractères? Plus précisément, je dois convertir UTF-8 en ISO-8859-15 et vice versa. Tout y passe: des lignes simples dans votre langage de script préféré, des outils en ligne …

526 text unicode utf-8 character-set

8

Quelle est la meilleure façon de supprimer les accents dans une chaîne unicode Python?

J'ai une chaîne Unicode en Python, et je voudrais supprimer tous les accents (diacritiques). J'ai trouvé sur le Web une manière élégante de le faire en Java: convertir la chaîne Unicode dans sa longue forme normalisée (avec un caractère séparé pour les lettres et les signes diacritiques) supprimez tous les …

507 python python-3.x unicode python-2.x diacritics

15

Quelle est la différence entre UTF-8 et Unicode?

J'ai entendu des opinions contradictoires de la part des gens - selon la page Wikipedia UTF-8 . C'est la même chose, non? Quelqu'un peut-il clarifier?

505 unicode encoding utf-8 character-encoding terminology

9

Convertir une chaîne Unicode en chaîne en Python (contenant des symboles supplémentaires)

Comment convertir une chaîne Unicode (contenant des caractères supplémentaires comme £ $, etc.) en une chaîne Python?

504 python string unicode type-conversion

12

UTF-8, UTF-16 et UTF-32

Quelles sont les différences entre UTF-8, UTF-16 et UTF-32? Je comprends qu'ils stockeront tous Unicode et que chacun utilise un nombre différent d'octets pour représenter un caractère. Y a-t-il un avantage à choisir l'un plutôt que l'autre?

487 unicode utf-8 utf-16 utf utf-32

12

Sauvegarde des textes utf-8 dans json.dumps en UTF8, pas en tant que séquence d'échappement \ u

exemple de code: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Le problème: ce n'est pas lisible par l'homme. Mes utilisateurs (intelligents) veulent vérifier ou même modifier des fichiers texte avec des vidages JSON (et je préfère ne pas utiliser XML). Existe-t-il un moyen de …

474 python json unicode utf-8 escaping

30

Meilleure façon d'inverser une chaîne

Je viens d'avoir à écrire une fonction de chaîne inversée en C # 2.0 (c'est-à-dire LINQ non disponible) et j'ai trouvé ceci: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; …

441 c# .net performance algorithm unicode

18

UnicodeDecodeError lors de la lecture d'un fichier CSV dans Pandas avec Python

J'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent cette erreur ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …

412 python pandas csv dataframe unicode

9

Quelle est la différence entre ASCII et Unicode?

Quelle est la différence exacte entre Unicode et ASCII? ASCII a un total de 128 caractères (256 dans l'ensemble étendu). Existe-t-il une spécification de taille pour les caractères Unicode?

407 unicode ascii

9

Qu'est-ce que Unicode, UTF-8, UTF-16?

Quelle est la base d'Unicode et pourquoi le besoin d'UTF-8 ou UTF-16? J'ai fait des recherches sur Google et cherché ici aussi, mais ce n'est pas clair pour moi. Dans VSS lors de la comparaison de fichiers, il y a parfois un message indiquant que les deux fichiers ont des …

395 unicode encoding utf-8 utf-16

5

Pourquoi 2+ 40 est égal à 42?

J'ai été déconcerté lorsqu'un collègue m'a montré cette ligne d'alerte JavaScript 42. alert(2+ 40); Exécuter l'extrait de codeMasquer les résultatsDévelopper l'extrait Il s'avère rapidement que ce qui ressemble à un signe moins est en fait un caractère Unicode obscur avec une sémantique clairement différente. Cela m'a laissé me demander pourquoi …

360 javascript unicode

11

Comment est-ce que je grep pour tous les caractères non-ASCII?

J'ai plusieurs fichiers XML très volumineux et j'essaie de trouver les lignes qui contiennent des caractères non ASCII. J'ai essayé ce qui suit: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Mais cela renvoie toutes les lignes du fichier, que la ligne contienne ou non un caractère dans la plage spécifiée. La syntaxe est-elle …

359 regex unix unicode grep

2

Différences de format Unicode, UTF, ASCII, ANSI

Quelle est la différence entre les Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, et ANSIencodages? En quoi ces informations sont-elles utiles aux programmeurs?

351 unicode character-encoding ascii ansi utf

6

Comment trouver la longueur d'une chaîne en R

Comment trouver la longueur d'une chaîne (nombre de caractères dans une chaîne) sans la diviser en R? Je sais trouver la longueur d'une liste mais pas d'une chaîne. Et qu'en est-il des chaînes Unicode? Comment trouver la longueur (en octets) et le nombre de caractères (runes, symboles) dans une chaîne …

348 r string unicode string-length

14

Lecture et écriture Unicode (UTF-8) dans des fichiers en Python

J'ai des problèmes de cerveau dans la compréhension de la lecture et de l'écriture de texte dans un fichier (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print …

331 python unicode utf-8 io

Questions marquées «unicode»