J'ai plusieurs milliers de pages de pages de livres numérisées. Chaque page est enregistrée individuellement au format JPG. L'écriture est claire, mais les polices varient et les pages contiennent des images et des illustrations.
Je dois créer une liste de tous les mots apparaissant dans chaque fichier JPG. Existe-t-il un outil en ligne de commande pour numériser une image répertoriant les mots qui apparaissent? Il n'a pas besoin d'avoir une numérisation parfaite, juste une estimation.