Je recherche une solution pour accélérer mon processus de numérisation de documents, en particulier pour les documents qui ne conviennent pas à un numériseur de documents classique doté d'un chargeur automatique de documents (ADF). Pour ces documents, j'utilise actuellement un scanner à plat.
Au début, je pensais qu'un matériel de numérisation plus rapide serait la solution (par exemple, un scanner d'appareil photo au lieu d'un scanner à plat typique). Mais j’ai remarqué que le temps total d’une numérisation ne représente que 20% du matériel de numérisation (mouvement de la tête de numérisation) mais 80% du logiciel (amélioration de l’image et reconnaissance optique des caractères).
Pour accélérer l'analyse, j'examinais les éléments suivants: (a) un logiciel d'analyse qui utiliserait non seulement un cœur / thread du processeur, mais plusieurs cœurs / threads. Malgré des recherches approfondies, je n'ai pas encore trouvé de programme multi-thread pour TWAIN. (b) workflow + software: programme permettant de définir mes propres profils de numérisation. Mais je n'ai pas encore trouvé de logiciel offrant des profils de numérisation et un bon recadrage automatique (et OCR non seulement en anglais). (c) flux de travail, c’est-à-dire déplacer OCR dans une étape distincte (mais je n’y ai pas gagné en vitesse, car le logiciel fourni avec mes scanneurs à plat CanoScan prend le même temps pour une numérisation, que j'inclue ou non OCR)
Comment puis-je accélérer mon balayage?
Pour ceux qui connaissent un logiciel tiers de numérisation de documents sur le marché: verrai-je une différence de vitesse considérable entre un processeur i7 double cœur et un processeur i7 quadricœur?
En tant que logiciel de numérisation de documents, je comprends les logiciels qui incluent des fonctionnalités d’amélioration d’image (redressement, recadrage automatique, par exemple), OCR (pas seulement pour l’anglais), la possibilité d’enregistrer plusieurs types de fichiers (jpg, jpeg2000, TIFF, PDF indexable). , PDF / A) et profils de numérisation (= combinaison définie par l’utilisateur de dpi, paramètres d’amélioration d’image, langue OCR, type de fichier).