Unicode est une norme pour l'encodage, la représentation et la manipulation de texte avec l'intention de prendre en charge tous les caractères requis pour un texte écrit incorporant tous les systèmes d'écriture, symboles techniques et ponctuation.
J'ai essayé d'utiliser java.io.FileReader pour lire certains fichiers texte et les convertir en une chaîne, mais j'ai trouvé que le résultat était mal encodé et pas du tout lisible. Voici mon environnement: Windows 2003, encodage du système d'exploitation: CP1252 Java 5.0 Mes fichiers sont codés UTF-8 ou CP1252, et certains …
Le problème est que, comme vous le savez, il y a des milliers de caractères dans le graphique Unicode et je veux convertir tous les caractères similaires en lettres qui sont en alphabet anglais. Par exemple, voici quelques conversions: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... …
Le projet ICU (qui a également maintenant une bibliothèque PHP ) contient les classes nécessaires pour aider à normaliser les chaînes UTF-8 afin de faciliter la comparaison des valeurs lors de la recherche. Cependant, j'essaie de comprendre ce que cela signifie pour les applications. Par exemple, dans quels cas est-ce …
Je veux quelque chose comme 0x2022 8226 BULLET • Mais plus gros. Je n'arrive même pas à les trouver sur http://www.ssec.wisc.edu/~tomw/java/unicode.html Que dois-je rechercher? Des points? des balles?
Qu'est-ce que le code de caractère (HTML) &#8203;? Je l'ai trouvé dans l'un de mes scripts jQuery et je me suis demandé ce que c'était. Merci. Éditer: Voici le script dans lequel il se trouvait (il a été ajouté à la fin, trouvé dans Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> …
De nombreuses implémentations modernes de regex interprètent le \wraccourci de classe de caractère comme «n'importe quelle lettre, chiffre ou ponctuation de connexion» (généralement: trait de soulignement). De cette façon, une expression régulière comme \w+matchs des mots comme hello, élève, GOÄ_432ou gefräßig. Malheureusement, ce n'est pas le cas de Java. En …
Je trouve Unicode pour les caractères spéciaux à partir de la recherche de FileFormat.Info . Certains caractères sont rendus comme les glyphes classiques en noir et blanc, tels que ⚠ (signe d'avertissement, \u26A0ou &#x26a0;). Ceux-ci sont préférables, car je peux leur appliquer des styles CSS (tels que la couleur). D'autres …
Je suis vraiment confus. J'ai essayé d'encoder mais l'erreur a dit can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Je sais comment éviter l'erreur avec le préfixe "u" sur …
Aucun des codes suivants ne fonctionne: p:before { content: " "; } p:before { content: "&nbsp;"; } Comment ajouter un espace blanc avant le contenu de l'élément? Remarque: je dois colorier la bordure gauche et la marge gauche pour une utilisation sémantique et utiliser l'espace comme marge incolore. :)
Je souhaite afficher un caractère Unicode en Java. Si je fais cela, cela fonctionne très bien: String symbol = "\u2202"; le symbole est égal à "∂". C'est ce que je veux. Le problème est que je connais le numéro Unicode et que je dois créer le symbole Unicode à partir …
J'essaye d'écrire un script Perl en utilisant le pragma "utf8" et j'obtiens des résultats inattendus. J'utilise Mac OS X 10.5 (Leopard) et j'édite avec TextMate. Tous mes paramètres pour mon éditeur et mon système d'exploitation sont définis par défaut sur l'écriture de fichiers au format utf-8. Cependant, lorsque j'entre ce …
Le standard Unicode contient suffisamment de points de code pour que vous ayez besoin de 4 octets pour tous les stocker. C'est ce que fait l'encodage UTF-32. Pourtant, l'encodage UTF-8 les comprime d'une manière ou d'une autre dans des espaces beaucoup plus petits en utilisant quelque chose appelé «encodage à …
Fermé . Cette question doit être plus ciblée . Il n'accepte pas les réponses actuellement. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle se concentre sur un problème uniquement en éditant ce message . Fermé il y a 6 ans . Améliorez cette question D'après votre …
Je connais le schéma non standard% uxxxx mais cela ne semble pas être un choix judicieux puisque le schéma a été rejeté par le W3C. Quelques exemples intéressants: Le caractère du cœur. Si je tape ceci dans mon navigateur: http://www.google.com/search?q=♥ Puis copiez et collez-le, je vois cette URL http://www.google.com/search?q=%E2%99%A5 ce …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.