Questions marquées «text-processing»

Manipulation ou examen de texte par des programmes, des scripts, etc.


2
Trouver tous les fichiers avec un Shebang Python
J'essaie d'exécuter une vérification PEP8 contre une grande arborescence source. L'arbre est composé d'un mélange de fichiers dans différentes langues. L'idée est de vérifier tous les scripts Python sans avoir à les lister explicitement. La majorité de ces fichiers n'ont pas réellement d' .pyextension. Existe-t-il un moyen simple de trouver …




5
Comment compter les lignes ordonnées par le premier champ dans bash
Voici un extrait de l'ENTRÉE: ... #################### Bala Bela;XXXXXX12345;XXXXXX12345678;A SERVER345Z3.DOMAIN.com0 SERVER346Z3.DOMAIN.com0 SERVER347Z3.DOMAIN.com0 SERVER348Z3.DOMAIN.com0 ssh-dss ...pubkeyhere... #################### Ize Jova;XXXXXX12345;XXXXXX12345;A SERVER342Z3.DOMAIN.com0 SERVER343Z3.DOMAIN.com0 SERVER345Z3.DOMAIN.com0 ssh-rsa ...pubkeyhere... ... Et voici un extrait de la sortie dont j'ai besoin: Bala Bela;XXXXXX12345;XXXXXX12345678;A 4 Ize Jova;XXXXXX12345;XXXXXX12345;A 3 J'ai donc besoin d'une SORTIE de l'ENTRÉE, pour que je …


2
Analyser XML, JSON et les nouveaux formats de fichiers de données sous UNIX à l'aide des utilitaires de ligne de commande
L'environnement Unix possède d'excellents outils pour analyser le texte sous diverses formes. Cependant, récemment, les données ne sont pas dans les formats traditionnels (historiques) (CSV, TSV, basés sur des enregistrements ou d'autres délimiteurs) qu'elles étaient auparavant. De nos jours, les données sont échangées dans des formats structurés comme XML / …

3
Faire deux choses avec la sortie d'une commande
J'ai un programme texcountqui génère le nombre de mots dans mon document LaTeX. Je peux également diriger la sortie de ceci pour sedcréer des sauts de ligne TeX et écrire ceci dans un fichier que je pourrai ensuite inclure dans mon document final. Mais quand je fais texcount foo.tex | …

3
Comment supprimer le dernier séparateur de virgules à la fin d'un fichier?
Comment supprimer le dernier séparateur de virgules d'un fichier sous Linux? Exemple de fichier: "is_supported_kafka_ranger" : "true", "kafka_log_dir" : "/var/log/kafka", "kafka_pid_dir" : "/var/run/kafka", "kafka_user" : "kafka", "kafka_user_nofile_limit" : "128000", "kafka_user_nproc_limit" : "65536", Résultats attendus: "is_supported_kafka_ranger" : "true", "kafka_log_dir" : "/var/log/kafka", "kafka_pid_dir" : "/var/run/kafka", "kafka_user" : "kafka", "kafka_user_nofile_limit" : "128000", "kafka_user_nproc_limit" …


4
Grep mot dans un fichier puis copiez le fichier
J'ai une collection de fichiers (* .zip, * .txt, * .tar.gz, * .doc, ... etc). Ces fichiers résident dans un chemin. Je veux trouver tous les fichiers (* .txt), puis copier uniquement les fichiers texte contenant des mots spécifiques (par exemple LINUX / UNIX). J'ai couru ce qui suit: find …

2
Gestion de 3 fichiers avec awk
Pensez aux fichiers suivants: file1: boo,8,1024 foo,7,2048 file2: foo,0,24,154 noo,0,10,561 file3: 24,154,7,1024,0 Ce dont j'ai besoin, c'est d'aller dans File1 et de vérifier si $2==7; si cela est vrai, prendre $1, $2et $3de Fichier1 ; maintenant je dois comparer si $1de Fichier1 égal à $1partir Fichier2 ; si c'est vrai, …

1
Mélangez deux fichiers texte parallèles
J'ai deux corpus parallèles alignés sur des phrases (fichiers texte) avec environ 50 millions de mots. (du corpus Europarl -> traduction parallèle de documents juridiques). Je voudrais maintenant mélanger les lignes des deux fichiers, mais les deux de la même manière. Je voulais aborder cela en utilisant gshuf (je suis …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.