J'ai reçu un certain nombre de fichiers pdf contenant des images. Les images originales ont été perdues, je dois donc les extraire. J'ai Adobe Acrobat Pro, je les ai donc extraits avec Advanced > Document Processing > Export All Images
(il y a quatre options: jpeg, png, tiff, jpeg2000). Mais, j'aimerais les extraire dans le format d'origine, et ce n'est apparemment pas du format jpeg: j'ai aussi testé pdfimages.exe à partir du format xpdf comme indiqué ici , ce qui donnait des fichiers .ppm, pas de jpeg.
J'ai donc essayé d'identifier ImageMagick. Voici ce qu'il m'a donné:
identify images-000.ppm
images-000.ppm PPM 870x1181 870x1181+0+0 8-bit sRGB 3.082MB 0.000u 0:00.000
Est-ce que cela indique qu'il s'agissait d'un fichier .bmp intégré? Comment dire? Je m'attendrais en fait à ce qu'une fonction dans Acrobat identifie le format des images, mais je ne l'ai pas trouvée.
Alors, quel est le meilleur moyen d'identifier le format d'image des images dans un pdf?
(Je préfère l'extraction via Acrobat en raison de la fonctionnalité de traitement par lots).