La réponse actuellement acceptée fait le travail, mais donne un résultat plus volumineux et une perte de qualité.
Ce que vous entendez par "perte de qualité" n'est pas clair. Cela pourrait signifier beaucoup de choses différentes. Pourriez-vous poster des exemples pour illustrer? Peut-être couper la même section des versions de mauvaise qualité et de bonne qualité (en tant que PNG pour éviter une perte de qualité supplémentaire).
Peut-être devez-vous utiliser -density
pour effectuer la conversion à un dpi plus élevé:
convert -density 300 file.pdf page_%04d.jpg
(Vous pouvez ajouter du préfixe -units PixelsPerInch
ou -units
PixelsPerCentimeter
si nécessaire. Ma copie par défaut est ppi.)
Mise à jour: Comme vous l'avez indiqué, gscan2pdf
(la façon dont vous l'utilisez) n'est qu'un wrapper pour pdfimages
(à partir de Poppler ). pdfimages
ne fait pas la même chose que convert
quand on donne un PDF en entrée.
convert
prend le PDF, le restitue à une certaine résolution et utilise le bitmap obtenu comme image source.
pdfimages
cherche dans le PDF des images bitmap incorporées et les exporte dans un fichier. Il ignore simplement les commandes de dessin textuelles ou vectorielles du PDF.
Par conséquent, si vous avez un fichier PDF qui encapsule une série de bitmaps, il pdfimages
sera beaucoup plus efficace de les extraire, car il vous donne les données brutes à leur taille originale. Vous voudrez probablement aussi utiliser l' -j
option pdfimages
car un PDF peut contenir des données JPEG brutes. Par défaut, pdfimages
tout est converti au format PNM et la conversion de JPEG> PPM> JPEG est un processus avec perte.
Alors, essaie
pdfimages -j file.pdf page
Vous pouvez ou ne pouvez pas besoin de suivre cela avec une convert
à l' .jpg
étape (selon le format bitmap PDF utilisait).
J'ai essayé cette commande sur un PDF que j'avais créé moi-même à partir d'une séquence d'images JPEG. Les images JPEG extraites étaient octet par octet identiques aux images source. Vous ne pouvez pas obtenir une qualité supérieure à celle.