J'utilise actuellement le lecteur PDF de Foxit et j'ai récemment téléchargé une image d'Internet, mais elle se trouve dans un fichier PDF. Comment extraire cette image?
Le système d'exploitation est Windows 7.
J'utilise actuellement le lecteur PDF de Foxit et j'ai récemment téléchargé une image d'Internet, mais elle se trouve dans un fichier PDF. Comment extraire cette image?
Le système d'exploitation est Windows 7.
Réponses:
Si vous n’avez pas besoin de la résolution originale en pixels de l’image, il suffit d’appuyer sur les boutons ALT et Imprimer l’écran. Ensuite, choisissez coller où vous voulez l'image.
L’autre façon de préserver la résolution consiste à ouvrir le fichier PDF dans un programme de retouche d’image tel que Adobe Photoshop et à l’utiliser avec celui-ci.
pdfimages.exe
pratique.
Si vous téléchargez XPDF pour Windows ( ici ), vous trouverez quelques fichiers .exe à l'intérieur. Vous pouvez les exécuter sans "installation". Utilisez pdfimages.exe
comme ceci:
pdfimages.exe -help
Cela affiche l'écran d'aide.
pdfimages.exe ^
-j ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Cela extrait tous les JPEG sous le préfixe-00N.jpg, et toutes les autres images sous le préfixe-00N.ppm (Portable PixMap).
[ Edit by ComFreek: Veuillez noter la barre oblique finale dans le chemin de destination, ce qui est important si vous ne voulez pas extraire toutes les images de son répertoire parent.] -
{ Edit de KurtPfeifle: Je ne suis pas d'accord avec le commentaire de ComFreek, mais laissez aux lecteurs de tester et de découvrir les différences de résultats eux-mêmes. Mon paramètre d'origine, sans barre oblique finale, ..\prefix
préfixera les noms d' image utilisés pour les fichiers extraits.}
pdfimages.exe ^
-j ^
-f 11 ^
-l 13 ^
c:\path\to\your.pdf ^
c:\path\to\where\you\want\images\prefix\
Comme auparavant, mais l'extraction des images est limitée aux pages 11 ('f' = premier) à 13 ('l' = dernier).
En attendant, je préfère la version de Poppler, enpdfimages
particulier depuis l’acquisition de cette nouvelle fonctionnalité: ajouter -list
à la ligne de commande afin de simplement lister (ne pas extraire) les images contenues dans le PDF, ainsi que certaines de leurs propriétés. Exemple:
pdfimages -list -f 7 -l 8 ct-magazin-14-2012.pdf page num type largeur hauteur couleur comp bpc enc interp ID d'objet -------------------------------------------------- ------------------- 7 0 image 581 838 RGB 3 8 Jpeg no 39 0 7 1 image 4 4 rgb 3 8 image no 40 0 7 2 image 314 332 RGB 3 8 jpx no 44 0 7 3 image 358 430 RGB 3 8 jpx no 45 0 7 4 image 4 4 rgb 3 8 image no 46 0 7 5 image 4 4 rgb 3 8 image no 47 0 7 6 image 4 6 rgb 3 8 image no 48 0 7 7 image 596 462 RGB 3 8 jpx no 49 0 7 8 image 4 6 rgb 3 8 image no 50 0 7 9 image 4 4 rgb 3 8 image no 51 0 7 10 image 8 10 rgb 3 8 image no 41 0 7 11 image 6 6 rgb 3 8 image no 42 0 7 12 image 113 27 rgb 3 8 jpx no 43 0 8 13 image 582 839 gris 1 8 jpeg no 2080 0 8 14 image 344 364 gris 1 8 jpx no 2079 0
Notez encore: cette version pdfimages
est celle de Poppler (celle de XPDF ne supporte pas (encore?) Cette nouvelle fonctionnalité), et la version doit être v0.20.2 ou plus récente.
convert
. Disponible pour Linux, Windows, MacOS X et ainsi de suite. Cas d' utilisation pour plus facile vous: convert some.ppm some.jpeg
.
pdfimages
également, et certaines personnes pourraient préférer l'utiliser.
Vous pouvez essayer d'importer le fichier PDF dans Inkscape et travailler à partir de là. Inkscape n'ouvrira qu'une page à la fois, mais vous donnera un contrôle total sur le contenu de la page. Vous pourrez extraire et manipuler des graphiques vectoriels à partir du PDF assez facilement.
Cependant, si vous souhaitez extraire des images raster du PDF, je suis presque sûr que pdfimages
XPDF est plus facile (vous pouvez quand même essayer d'utiliser Inkscape après avoir appris à extraire des images incorporées à partir de fichiers SVG ).
Sans installer de logiciel, vous pouvez passer à PDF-XChange Viewer (sélectionnez Version portable ), qui dispose déjà de cette possibilité.
peut enregistrer plusieurs pages au format TIFF multipage
Notez que lorsque cette méthode convertit des pages PDF entières en images, la méthode expliquée à partir de @Laurenz à l' aide de Sumatra PDF est supérieure si vous souhaitez extraire des images d'une page PDF avec un contenu mixte (image + texte) pour obtenir uniquement l'image.
Sumatra PDF est un lecteur PDF open source rapide et léger, capable de copier des images directement dans le Presse-papiers, sans aucune nouvelle numérisation.
MuPDF est une nouvelle visionneuse PDF multiplateforme (ordinateurs de bureau et mobiles) (créée en 2006) publiée sous licence AGPL. Il est maintenu par les mêmes personnes de Ghostscript .
Il contient un outil de ligne de commande permettant d’extraire des images d’un fichier PDF:
mutool extract [options] file.pdf [object numbers]
La commande extraire peut être utilisée pour extraire des images et des fichiers de polices d’un fichier PDF. Si aucun numéro d'objet n'est donné sur la ligne de commande, toutes les images et les polices seront extraites.
-p password
Use the specified password if the file is encrypted.
-r Convert images to RGB when extracting them.
utiliser pdftocairo
de poppler toolkit
. Il peut extraire et convertir des images de pdf au format souhaité. Il génère toujours des images et ne génère jamais de ppm ou de craps comme ça. La commande suivante convertit les pages pdf en images jpg:
pdftocairo.exe -jpeg "my.pdf" "my"
Vous pouvez l'obtenir d'ici pour Windows: http://blog.alivate.com.au/poppler-windows/
Il est également disponible sur Linux.
http://www.sumnotes.net/ est un outil en ligne permettant d'extraire des notes, des points forts et des images. Je l'ai beaucoup utilisé à l'université pour ma thèse et j'étais vraiment satisfait.
normalement, j'extrais l'image incorporée avec 'pdfimages' à la résolution native, puis j'utilise Convert au format souhaité: ImageMagick:
$ pdfimages -list fileName.pdf
$ pdfimages fileName.pdf fileName # save in .ppm format
$ convert fileName-000.ppm fileName-000.png
cela génère le meilleur et le plus petit fichier de résultats.
Remarque: pour les images incorporées avec perte au format JPG, vous deviez utiliser -j:
$ pdfimages -j fileName.pdf fileName # save in .jpg format
Sur la plate-forme Win peu fournie, vous deviez télécharger un binaire récent (0.37, 2015) 'poppler-util' à partir de: http://blog.alivate.com.au/poppler-windows/
MISE À JOUR: Sur les dernières versions de "poppler-util" 0.50+ (2016), pdfunite dispose d'une option "-all" permettant d'extraire un bitmap compressé sans perte au format .png et un compressé au format bitmap compressé avec perte au format .jpg.
$ pdfimages -all fileName.pdf fileName
extraire toujours du contenu PDF de la meilleure qualité possible