J'ai vu des ebooks / papiers qui ont apparemment été scannés à partir de leurs versions papier mais le texte des ebooks / papiers peut être étonnamment copié. Je suppose que les versions directement numérisées doivent avoir été traitées par certains logiciels de reconnaissance optique de caractères.
J'aimerais donc savoir quels sont les logiciels de reconnaissance optique de caractères recommandés? Surtout ceux qui sont soit pour Ubuntu, soit gratuits? Si ceux pour Windows sont bien plus performants, faites-le moi savoir également.
Je suis particulièrement intéressé par les OCR qui peuvent accepter un fichier pdf numérisé en entrée et toujours produire en sortie un autre fichier pdf qui ressemble à celui en entrée mais avec son texte copiable.
Merci et salutations!
Veuillez limiter un logiciel par réponse