Comment puis-je redresser et recadrer des fichiers PDF créés à partir de pages numérisées * automatiquement *? [dupliquer]


13

Duplicata possible:
quel logiciel gratuit puis-je utiliser pour redresser les images numérisées

J'ai plusieurs PDF composés de numérisations de pages de livre. Les numérisations sont faites à partir de deux pages à la fois et certaines de ces numérisations sont asymétriques, donnant au texte une légère inclinaison.

Je recherche un outil qui pourrait me permettre de faire une optimisation automatique en redirigeant les scans sans perdre en lisibilité. J'ai trouvé le logiciel GPL Briss pour recadrer les numérisations afin d'avoir un rapport de page 1: 1 au lieu de 2: 1, mais je n'ai pas d'outil pour redresser les pages.

Je suis tombé sur unpaper , un autre outil open source qui semble parfait pour ce que je veux faire, mais cet outil est uniquement Linux et ne fonctionne pas directement sur les fichiers PDF.

Tout indice est apprécié.


1
@random: Pourquoi cette question a-t-elle été fermée ?? Pourquoi ce sujet devrait-il susciter «un débat, des arguments, un sondage ou une discussion approfondie»?!?
Kurt Pfeifle

1
«chercher un outil» est à peu près un sondage pour les services mène à la raison proche non constructive @kur
aléatoire

1
@random: Cette question m'a amené à faire des recherches sur le sujet, et j'ai trouvé des options intéressantes à poursuivre. Le plus intéressant utilise ImageMagick pour cela, et cela semble étonnamment simple. Malheureusement, votre clôture de cela ne me permet pas de poster ma réponse.
Kurt Pfeifle

@random: Je viens de modifier un peu la question. Espérons que cela soit désormais plus conforme à votre sens de la «constructivité».
Kurt Pfeifle

@random: Ok, «fermer en double» est mieux acceptable pour moi dans ce cas.
Kurt Pfeifle

Réponses:


9

Jetez un oeil à redresser . C'est un outil en ligne de commande. Le téléchargement * zip semble inclure des fichiers binaires pour Windows, MacOSX et Linux.

La licence est MPL (Mozilla) ou LPGL (GNU), selon ce que vous préférez.

Le seul inconvénient pour vous semble être qu'il ne consomme pas de PDF, uniquement des images PNG et TIFF (AFAICS). Cela signifie que vous devrez mettre en place un workflow de s.th. comme:

 PDF.orig -> PNG.orig -> PNG.deskewed -> PDF.deskewed

Je ne l'ai pas testé moi-même (encore), je suis récemment tombé sur le site Web et l'ai mis en signet.


deskewa réussi à corriger la distorsion liée à la rotation dans mon test, mais malheureusement, il a introduit une fine ligne grise à la position de la bordure de l'image d'origine. Pour me débarrasser de la bordure grise, j'ai recadré les images avec l' -extentoption de mogrify. J'ai seulement testé sur OS X, peut-être que ce mauvais comportement est spécifique à la plate-forme.
Stefan Schmidt

deskewfonctionne vraiment bien. Mon flux de travail est le suivant: pdfimages -all <pdf> my_imagesjbig2 -s -p -v my_images* > outputpdf.py output > deskewed.pdfSi les bordures noires (résultat de l'opération de redressement) vous dérangent , un traitement avec imagemagick peut être nécessaire, comme suggéré par @StefanSchmidt
M. Tao

5

Oh, permettez-moi d'ajouter une autre réponse. Je viens de me souvenir de netpbm . Je ne l'ai pas utilisé depuis des années, mais je pense que je devrais y jeter un nouveau regard ...

netpbm est une boîte à outils très puissante pour la ligne de commande pour manipuler des images graphiques. Il expédie près de 300 outils distincts. Il comprend des convertisseurs pour environ 100 formats graphiques.

Et il dispose également d'un outil en ligne de commande qui peut faire pivoter les images:

pnmrotate

Et il a un autre outil qui essaie de découvrir l'angle des images pivotées:

pamtilt

pamtiltrenvoie un nombre flottant de sa supposition de rotation de l'image. La suppression automatique de la distorsion des images doit donc être à portée de main. Un script shell pourrait être écrit pour cela. Cela nécessiterait différentes étapes:

  1. Convertissez la page PDF en un format d'image adapté à netpbm à l'aide de Ghostscript.
  2. Utilisez pamtiltpour découvrir automatiquement l'angle d'inclinaison de l'image.
  3. Utilisez pnmrotatepour dé-biaiser l'image.
  4. Reconvertissez l'image au format PDF.

Si vous me donnez accès à un petit échantillon de vos fichiers PDF, je pourrais essayer de trouver un script shell pour accomplir l'exploit.


(Je me demande fortement que [netpbm] ne semble pas avoir de balise ici sur le superutilisateur + stackoverflow.)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.