Open source préféré, mais pas nécessaire.
J'ai Adobe Acrobat 8 et j'aime vraiment la fonction OCR qui peut essentiellement mettre une couche invisible de texte OCR au-dessus d'un document numérisé. Ainsi, ce que vous voyez à l'écran est le document numérisé d'origine, mais le résultat est consultable.
Ce que je recherche, c'est un moyen d'automatiser ce processus. J'ai actuellement quelques scripts que nous utilisons pour le traitement et l'archivage des fichiers numérisés, et je cherche quelque chose que je peux connecter directement à ce processus par lots pour faire de l'OCR d'une manière similaire à ce que je peux faire avec Acrobat.
Toutes les suggestions sont les bienvenues, merci!