Questions marquées «unicode»

Unicode est une norme pour l'encodage, la représentation et la manipulation de texte avec l'intention de prendre en charge tous les caractères requis pour un texte écrit incorporant tous les systèmes d'écriture, symboles techniques et ponctuation.


5
Exemple de données de test UTF-8 vraiment bonnes, mauvaises [fermé]
Fermé. Cette question ne respecte pas les directives de Stack Overflow . Il n'accepte pas les réponses actuellement. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle soit pertinente pour Stack Overflow. Fermé il y a 3 ans . Améliorez cette question Nous avons donc la feuille …
88 unicode  utf-8 

8
Comment puis-je remplacer des caractères Unicode non imprimables en Java?
Ce qui suit remplacera les caractères de contrôle ASCII (raccourci pour [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); Ce qui suit remplacera tous les caractères ASCII non imprimables (raccourci pour [\p{Graph}\x20]), y compris les caractères accentués: my_string.replaceAll("[^\\p{Print}]", "?"); Cependant, ni l'un ni l'autre ne fonctionne pour les chaînes Unicode. Quelqu'un a-t-il un bon moyen …
88 java  string  unicode 

12
TCHAR est-il toujours pertinent?
Je suis nouveau dans la programmation Windows et après avoir lu le livre Petzold, je me demande: est-ce toujours une bonne pratique d'utiliser le TCHARtype et la _T()fonction pour déclarer des chaînes ou si je devrais simplement utiliser les chaînes wchar_tet L""dans le nouveau code? Je ciblerai uniquement Windows 2000 …
87 c++  c  windows  unicode  wchar-t 

2
Regex: qu'est-ce que InCombiningDiacriticalMarks?
Le code suivant est très connu pour convertir les caractères accentués en texte brut: Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); J'ai remplacé ma méthode "faite à la main" par celle-ci, mais je dois comprendre la partie "regex" de replaceAll 1) Qu'est-ce que "InCombiningDiacriticalMarks"? 2) Où en est la documentation? (et similaires?) Merci.
86 java  regex  unicode 



2
Quel est le «problème» avec le C ++ wchar_t et wstrings? Quelles sont les alternatives aux caractères larges?
J'ai vu beaucoup de gens dans la communauté C ++ (en particulier ## c ++ sur freenode) se plaindre de l'utilisation de wstringsand wchar_t, et de leur utilisation dans l'API Windows. Qu'est-ce qui ne va pas exactement avec wchar_tet wstring, et si je veux soutenir l'internationalisation, quelles sont les alternatives …

1
WebClient.DownloadString entraîne des caractères mutilés en raison de problèmes d'encodage, mais le navigateur fonctionne correctement
Le code suivant: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); donne une variable textqui contient, entre autres, la chaîne "$ κ $ -espace de Minkowski, champ scalaire et problème de l'invariance de Lorentz" Cependant, lorsque je visite cette URL dans Firefox, j'obtiens $ κ $ -Espace de Minkowski, champ scalaire et problème …




3
Quels personnages sont regroupés avec Array.from?
J'ai joué avec JS et je n'arrive pas à comprendre comment JS décide quels éléments ajouter au tableau créé lors de l'utilisation Array.from(). Par exemple, l'emoji 👍 suivant a un lengthde 2, car il est composé de deux points de code, mais Array.from()traite ces deux points de code comme un, …

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.