Unicode est une norme de l'industrie informatique pour l'encodage, la représentation et la gestion cohérents du texte exprimé dans la plupart des systèmes d'écriture du monde.
Je viens de tomber sur une capture d'écran du terminal de quelqu'un: Existe-t-il une liste de tous les caractères pouvant être utilisés dans une invite Bash, ou quelqu'un peut-il me fournir le caractère de l'étoile et de la flèche droite?
J'ai un fichier en codage UTF-8 avec nomenclature et je souhaite supprimer la nomenclature. Existe-t-il des outils de ligne de commande linux pour supprimer la nomenclature du fichier? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines
J'aimerais contribuer à un projet open source fournissant des chaînes traduites. L'une de leurs exigences est que les contributeurs doivent utiliser UTF-8 comme encodage pour les fichiers PO. J'utilise VIM 7.3 sur Linux. Comment puis-je être sûr que le codage de VIM est défini sur UTF-8, de sorte que je …
Si j'exécute le script simple suivant: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Il imprime: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz c'est-à-dire que le texte avec des trémas (tels que ü) est "réduit" d'un caractère par tréma. …
J'ai un fichier texte dans un encodage inconnu ou mixte. Je souhaite afficher les lignes contenant une séquence d'octets non valide UTF-8 (en transférant le fichier texte dans un programme). De manière équivalente, je veux filtrer les lignes qui sont valides UTF-8. En d'autres termes, je cherche .grep [notutf8] Une …
Alors, je regardais cette réponse sur stackoverflow et me suis rendu compte que mes polices ne couvraient pas une grande partie du spectre unicode utf-8 (car je reçois beaucoup de carrés). Est-ce que quelqu'un connaît une police qui couvrira tout ce post?
Le code simple fonctionne ici comme prévu sur ma machine s'il est lancé avec bash: function ⏰(){ date } ⏰ Pourrait-il y avoir un problème pour les autres utilisateurs, ou est-ce universel? Je me demande parce que je n'ai jamais rien vu de tel dans un autre code source pour …
J'essaie de supprimer certains caractères du fichier (UTF-8). J'utilise trà cette fin: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Le fichier contient des caractères étrangers (comme "Латвийская" ou "àé"). trne semble pas les comprendre: il les traite comme des non-alpha et les supprime aussi. J'ai essayé de modifier certains de mes …
Par exemple: sed 's/\u0091//g' file1 En ce moment, je dois faire hexdumppour obtenir le numéro hexadécimal et le mettre sedcomme suit: $ echo -ne '\u9991' | hexdump -C 00000000 e9 a6 91 |...| 00000003 Et alors: $ sed 's/\xe9\xa6\x91//g' file1
J'ai récemment mis à jour mon serveur Arch Linux et au cours de ce processus, tmux a été mis à jour. J'utilisais tmuxpendant la mise à niveau et je l'ai utilisé par la suite, mais tout au cours de la même session SSH. Maintenant, cependant, chaque fois que j'essaie d'émettre …
Cette question a été migrée depuis Stack Overflow car il est possible d'y répondre sur Unix & Linux Stack Exchange. Migré il y a 8 ans . J'utilise la commande suivante pour grep plage de jeux de caractères pour le code hexadécimal 0900 (au lieu de अ) à 097F (au …
ɛ("Latin epsilon") est une lettre utilisée dans certaines langues africaines, généralement pour représenter le son de voyelle en anglais "bed". En Unicode, il est codé en U + 025B, très différent du quotidien e. Cependant, si je fais sortce qui suit: eb ed ɛa ɛc il semble que sortconsidère ɛet …
J'ai une liste de points de code Unicode, mais je ne connais pas de moyen "simple" de convertir ces valeurs hexadécimales en caractères réels qu'elles représentent ... J'ai entendu dire que zsh l' a fait echo -e '\u0965', mais j'utilise bash 4.1. Existe-t-il quelque chose d'aussi simple que la méthode …
En Unicode, certaines combinaisons de caractères ont plus d'une représentation. Par exemple, le caractère ä peut être représenté par "ä", c'est-à-dire le point de code U + 00E4 (deux octets c3 a4dans le codage UTF-8), ou "ä", c'est-à-dire les deux points de code U + 0061 U + 0308 (trois …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.