Il se trouve que j’ai une grande collection de livres électroniques, qui sont des PDF et DjVus (avec calque de texte). J'aimerais pouvoir "rechercher" le contenu de mes livres numériques à la recherche d'expressions. Après avoir passé un peu de temps à chercher le problème sur Google, je n’ai trouvé aucun logiciel (à l’exception de Google Desktop Search abandonné) capable de lire les calques de texte dans les fichiers .djvu.
Mes besoins sont assez simples: je n'ai pas besoin d'indexer les courriels, les métadonnées dans les fichiers JPG, etc. Juste des fichiers PDF et DjVus et peut-être des fichiers texte. J'ai besoin de bien contrôler ce qu'il faut indexer (un seul répertoire, et rien de plus).
J'utilise Windows.
Est-ce que quelqu'un ici connaît une solution à ce problème?
Les programmes que j'ai regardés jusqu'ici sont:
- Beagle
- Copernic Desktop Search
- Terrier
- Google Desktop (discontinué)
Le meilleur conseil est peut-être de s'en tenir à Google Desktop Search. Si oui, peut-il être configuré pour n’indexer que des répertoires spécifiques?