Unicode est une norme pour l'encodage, la représentation et la manipulation de texte avec l'intention de prendre en charge tous les caractères requis pour un texte écrit incorporant tous les systèmes d'écriture, symboles techniques et ponctuation.
Quel est l'outil ou la méthode la plus rapide et la plus simple pour convertir des fichiers texte entre des jeux de caractères? Plus précisément, je dois convertir UTF-8 en ISO-8859-15 et vice versa. Tout y passe: des lignes simples dans votre langage de script préféré, des outils en ligne …
J'ai une chaîne Unicode en Python, et je voudrais supprimer tous les accents (diacritiques). J'ai trouvé sur le Web une manière élégante de le faire en Java: convertir la chaîne Unicode dans sa longue forme normalisée (avec un caractère séparé pour les lettres et les signes diacritiques) supprimez tous les …
Quelles sont les différences entre UTF-8, UTF-16 et UTF-32? Je comprends qu'ils stockeront tous Unicode et que chacun utilise un nombre différent d'octets pour représenter un caractère. Y a-t-il un avantage à choisir l'un plutôt que l'autre?
exemple de code: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" Le problème: ce n'est pas lisible par l'homme. Mes utilisateurs (intelligents) veulent vérifier ou même modifier des fichiers texte avec des vidages JSON (et je préfère ne pas utiliser XML). Existe-t-il un moyen de …
Je viens d'avoir à écrire une fonction de chaîne inversée en C # 2.0 (c'est-à-dire LINQ non disponible) et j'ai trouvé ceci: public string Reverse(string text) { char[] cArray = text.ToCharArray(); string reverse = String.Empty; for (int i = cArray.Length - 1; i > -1; i--) { reverse += cArray[i]; …
J'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent cette erreur ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …
Quelle est la différence exacte entre Unicode et ASCII? ASCII a un total de 128 caractères (256 dans l'ensemble étendu). Existe-t-il une spécification de taille pour les caractères Unicode?
Quelle est la base d'Unicode et pourquoi le besoin d'UTF-8 ou UTF-16? J'ai fait des recherches sur Google et cherché ici aussi, mais ce n'est pas clair pour moi. Dans VSS lors de la comparaison de fichiers, il y a parfois un message indiquant que les deux fichiers ont des …
J'ai été déconcerté lorsqu'un collègue m'a montré cette ligne d'alerte JavaScript 42. alert(2+ 40); Exécuter l'extrait de codeMasquer les résultatsDévelopper l'extrait Il s'avère rapidement que ce qui ressemble à un signe moins est en fait un caractère Unicode obscur avec une sémantique clairement différente. Cela m'a laissé me demander pourquoi …
J'ai plusieurs fichiers XML très volumineux et j'essaie de trouver les lignes qui contiennent des caractères non ASCII. J'ai essayé ce qui suit: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Mais cela renvoie toutes les lignes du fichier, que la ligne contienne ou non un caractère dans la plage spécifiée. La syntaxe est-elle …
Quelle est la différence entre les Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, et ANSIencodages? En quoi ces informations sont-elles utiles aux programmeurs?
Comment trouver la longueur d'une chaîne (nombre de caractères dans une chaîne) sans la diviser en R? Je sais trouver la longueur d'une liste mais pas d'une chaîne. Et qu'en est-il des chaînes Unicode? Comment trouver la longueur (en octets) et le nombre de caractères (runes, symboles) dans une chaîne …
J'ai des problèmes de cerveau dans la compréhension de la lecture et de l'écriture de texte dans un fichier (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) ("u'Capit \ xe1n '", "' Capit \ xc3 \ xa1n '") print …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.