Un outil semblable à Grep pour tous les types de fichiers?


1

Existe-t-il un outil semblable à grep / ack / grin pour tous les types de fichiers (y compris MS Office, PDF, etc.)? Je suis souvent amené à chercher dans un dossier ou un disque entier des chaînes contenues dans des fichiers qui ne se limitent pas à du texte en clair.

Je suis particulièrement intéressé par les solutions OSX, mais également par les solutions multiplateformes et, dans une moindre mesure, UNIX / Windows.

Merci.


1
Juste pour clarifier, vous voulez un outil pouvant ouvrir un type de fichier, par exemple pdf, puis rechercher le texte à l'intérieur du type de fichier, tel que pdf, et inclure ses résultats dans le jeu de résultats final. Vous ne voulez pas rechercher le pdf en tant que données brutes? Agréable!
Guy Coder

Tous les types de fichiers dont vous avez besoin sont-ils ici? support.google.com/webmasters/bin/…
Guy Coder

Oui, ils sont sûrs. Vous suggérez que Google peut indexer mon Mac?
user72923

Réponses:



1

Je ne connais pas d'utilitaire unique capable de tout gérer, mais voici quelques options utiles:

  1. des chaînes (du paquet binutils)
  2. lesspipe (du paquet moins)
  3. anti-mot
  4. odt2txt
  5. pdftotext (de poppler-utils)

Tout le reste, et vous aurez probablement besoin d'exécuter / usr / bin / file pour voir si vous pouvez trouver un paquet qui vous permettra de convertir en un format canonique que vous saurez gérer.


Voir les commentaires ci-dessus pour clarification. Vous recherchez principalement des types de fichiers courants tels que MS Office et PDF.
user72923

0

Non, l'ensemble de tous les types de fichiers et encodages de texte est trop volumineux pour qu'un seul programme puisse les analyser tous.

Considérons par exemple

  • Format de fichier mod Amiga Noisetracker (contient les noms d'instruments, etc.)
  • Fichier IBM VSAM contenant EBCDIC?
  • Fichier Lotus Notes OS / 2 (chiffré)

Qu'en est-il des types de fichiers majeurs comme ceux énumérés par Guy Coder dans les commentaires? Connaissez-vous un outil qui gère parfaitement ces types de fichiers? MS Office et PDF sont les priorités principales.
user72923
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.