Unix & Linux unicode

3

Symboles et personnages impressionnants dans une invite bash

Je viens de tomber sur une capture d'écran du terminal de quelqu'un: Existe-t-il une liste de tous les caractères pouvant être utilisés dans une invite Bash, ou quelqu'un peut-il me fournir le caractère de l'étoile et de la flèche droite?

81 bash prompt unicode

6

Comment puis-je supprimer la nomenclature d'un fichier UTF-8?

J'ai un fichier en codage UTF-8 avec nomenclature et je souhaite supprimer la nomenclature. Existe-t-il des outils de ligne de commande linux pour supprimer la nomenclature du fichier? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines

64 command-line files unicode

2

Comment définir le codage par défaut de VIM sur UTF-8?

J'aimerais contribuer à un projet open source fournissant des chaînes traduites. L'une de leurs exigences est que les contributeurs doivent utiliser UTF-8 comme encodage pour les fichiers PO. J'utilise VIM 7.3 sur Linux. Comment puis-je être sûr que le codage de VIM est défini sur UTF-8, de sorte que je …

62 vim character-encoding unicode

2

Pourquoi printf "rétrécit-il" le tréma?

Si j'exécute le script simple suivant: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Il imprime: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz c'est-à-dire que le texte avec des trémas (tels que ü) est "réduit" d'un caractère par tréma. …

54 bash unicode printf

6

Filtrage de utf8 invalide

J'ai un fichier texte dans un encodage inconnu ou mixte. Je souhaite afficher les lignes contenant une séquence d'octets non valide UTF-8 (en transférant le fichier texte dans un programme). De manière équivalente, je veux filtrer les lignes qui sont valides UTF-8. En d'autres termes, je cherche .grep [notutf8] Une …

50 command-line text-processing character-encoding unicode

2

Quelles polices conviennent aux glyphes Unicode

Alors, je regardais cette réponse sur stackoverflow et me suis rendu compte que mes polices ne couvraient pas une grande partie du spectre unicode utf-8 (car je reçois beaucoup de carrés). Est-ce que quelqu'un connaît une police qui couvrira tout ce post?

38 fonts unicode

1

Devrions-nous utiliser des caractères UTF-8 comme dans un script bash / shell?

Le code simple fonctionne ici comme prévu sur ma machine s'il est lancé avec bash: function ⏰(){ date } ⏰ Pourrait-il y avoir un problème pour les autres utilisateurs, ou est-ce universel? Je me demande parce que je n'ai jamais rien vu de tel dans un autre code source pour …

36 bash shell unicode

1

Comment faire en sorte que les caractères non ascii (unicode) soient pris en compte?

J'essaie de supprimer certains caractères du fichier (UTF-8). J'utilise trà cette fin: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Le fichier contient des caractères étrangers (comme "Латвийская" ou "àé"). trne semble pas les comprendre: il les traite comme des non-alpha et les supprime aussi. J'ai essayé de modifier certains de mes …

36 linux text-processing unicode tr

6

Existe-t-il une alternative à sed prenant en charge l’unicode?

Par exemple: sed 's/\u0091//g' file1 En ce moment, je dois faire hexdumppour obtenir le numéro hexadécimal et le mettre sedcomme suit: $ echo -ne '\u9991' | hexdump -C 00000000 e9 a6 91 |...| 00000003 Et alors: $ sed 's/\xe9\xa6\x91//g' file1

33 sed unicode hexdump

5

J'ai mis à jour mon serveur Linux Arch et maintenant j'obtiens tmux: j'ai besoin des paramètres régionaux UTF-8 (LC_CTYPE) mais j'ai ANSI_X3.4-1968

J'ai récemment mis à jour mon serveur Arch Linux et au cours de ce processus, tmux a été mis à jour. J'utilisais tmuxpendant la mise à niveau et je l'ai utilisé par la suite, mais tout au cours de la même session SSH. Maintenant, cependant, chaque fois que j'essaie d'émettre …

29 arch-linux tmux locale unicode

4

Comment spécifier des caractères en utilisant des codes hexadécimaux dans `grep`?

Cette question a été migrée depuis Stack Overflow car il est possible d'y répondre sur Unix & Linux Stack Exchange. Migré il y a 8 ans . J'utilise la commande suivante pour grep plage de jeux de caractères pour le code hexadécimal 0900 (au lieu de अ) à 097F (au …

27 shell grep character-encoding unicode

3

Pourquoi le tri dit-il que ɛ = e?

ɛ("Latin epsilon") est une lettre utilisée dans certaines langues africaines, généralement pour représenter le son de voyelle en anglais "bed". En Unicode, il est codé en U + 025B, très différent du quotidien e. Cependant, si je fais sortce qui suit: eb ed ɛa ɛc il semble que sortconsidère ɛet …

25 sort locale unicode

6

En bash, comment puis-je convertir un point de code Unicode [0-9A-F] en un caractère imprimable?

J'ai une liste de points de code Unicode, mais je ne connais pas de moyen "simple" de convertir ces valeurs hexadécimales en caractères réels qu'elles représentent ... J'ai entendu dire que zsh l' a fait echo -e '\u0965', mais j'utilise bash 4.1. Existe-t-il quelque chose d'aussi simple que la méthode …

23 bash unicode

6

Convertir entre les formulaires de normalisation Unicode sur la ligne de commande unix

En Unicode, certaines combinaisons de caractères ont plus d'une représentation. Par exemple, le caractère ä peut être représenté par "ä", c'est-à-dire le point de code U + 00E4 (deux octets c3 a4dans le codage UTF-8), ou "ä", c'est-à-dire les deux points de code U + 0061 U + 0308 (trois …

22 command-line text-processing conversion unicode

8

comment taper «citations intelligentes» (U + 201C, U + 201D)

C'est comme ça: “(U + 201C) ”(U + 201D).

22 xorg keyboard special-characters unicode

Questions marquées «unicode»