Outil en ligne de commande pour rechercher des fichiers docx


9

Existe-t-il un outil en ligne de commande pour rechercher du texte dans un fichier docx? J'ai essayé grep, mais cela ne fonctionne pas avec docx même s'il fonctionne bien avec les fichiers txt et xml. Je pourrais d'abord convertir le docx en txt, mais je préférerais un outil qui fonctionne directement sur les fichiers docx. J'ai besoin de l'outil pour travailler sous Cygwin.

OP edit: Plus tard, j'ai découvert que le moyen le plus simple de réaliser le grep est en fait de convertir ces docx en txt puis de les grep.



Je me suis débarrassé de la partie DOS, car c'est hors sujet ici
Michael Mrozek

Réponses:


3

Je connais plusieurs outils d'indexation qui prennent en charge les documents Word. Ces outils vous permettent d'indexer des documents, puis de rechercher efficacement des mots dans l'index. Ils ne permettent pas les recherches en texte intégral.


1

DOCx est compressé et ce n'est pas un format texte. Il vous faut donc d'abord un convertisseur . Après cela, vous pouvez utiliser la findcommande sur le ou les fichiers convertis.


Ou vous pouvez utiliser un outil de recherche qui peut lire à l'intérieur des fichiers compressés. Dans votre dernière phrase, je suppose que vous vouliez dire grep?
Gilles 'SO- arrête d'être méchant'

@Gilles - regardez le titre original de la question avant que Michael ne la modifie. Cela semblait être une question sur DOS (et je l'ai signalé hors sujet).
Nils

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.