Comment parcourir la structure PDF interne dans Adobe 9.0?
Je n'ai pas trouvé le menu avancé qui a cette option.
Un corps peut-il m'aider?
Comment parcourir la structure PDF interne dans Adobe 9.0?
Je n'ai pas trouvé le menu avancé qui a cette option.
Un corps peut-il m'aider?
Réponses:
Il existe plusieurs façons de parcourir la structure interne d'un PDF.
À l'exception des mots de passe de sécurité, une grande partie est lisible par l'homme. Si un PDF a un mot de passe, toutes les chaînes et flux (qui seront déjà compressés, aucune perte) seront des ordures pseudo-aléatoires. Les flux de données compressés abondent, mais une grande partie ressemble à ceci dans votre éditeur de texte préféré:
2 0 obj
<< /Type /Page
/MediaBox [0 0 612 792]
/Contents 4 0 R
/Resources << /Fonts
<< /F1 5 0 R>>
>>
>>
endobj
Avertissement: les espaces blancs ne sont pas pertinents et sont généralement supprimés lorsque cela est possible. Je viens de rendre cela joli pour faciliter la compréhension un peu.
<< et >> commencent et terminent les "dictionnaires". Les dictionnaires sont constitués de paires clé / valeur. La clé est toujours un "nom": tous les noms commencent par '/'. La valeur peut être n'importe quoi, y compris un autre nom.
[ et ] commencent et terminent les "tableaux". Les tableaux peuvent être constitués de presque tout.
Les nombres sont des "nombres". Virgule flottante ou autre.
() et <> commencent et terminent les "chaînes". Les chaînes <> sont répertoriées sous forme de valeurs hexadécimales, () sont des chaînes ANSI.
Pet Peeve: / Les noms et (chaînes) utilisent des systèmes d'échappement entièrement différents. Grr.
Les références indirectes pointent vers d'autres objets dans le PDF:
<objNum> <generationNum-AlwaysZero> R
Dans l'exemple ci-dessus, le flux de contenu se trouve dans l'objet 4, ailleurs dans le PDF. Pour le trouver, vous pouvez utiliser la recherche de texte de votre éditeur pour "N 0 obj" où N est le numéro d'objet que vous souhaitez.
AVERTISSEMENT: il y a des centaines, voire des milliers d'objets dans un PDF. La recherche de "1 0 obj" vous donnera BEAUCOUP de hits.
Étant donné que vous demandez à voir la structure interne, vous savez probablement déjà tout cela. D'autres qui veulent savoir la même chose peuvent ne pas le faire.
AVERTISSEMENT: N'EDITEZ PAS un PDF dans un éditeur de texte. Tous ces éléments binaires seront altérés, les décalages d'octets sont très importants en PDF.
Il existe un plugin acrobate appelé PDF CanOpener par Windjack Solutions (sans affiliation). C'est SLICK. Vous pourrez parcourir la structure PDF sous forme d'arborescence, regarder (et modifier) les flux de contenu, etc.
Beaucoup. Beaucoup de gens en construisent un dans le cadre de l'apprentissage de l'analyse PDF ou comme outil de débogage. Ils sont assez pratiques.
iText RUPS (partie d'iText, une bibliothèque Java PDF, maintenant sur GitHub)
O2Solutions offre un utilitaire compatible MS Windows pour visualiser la structure interne des documents PDF. C'est gratuit pour un usage personnel et commercial.
Vous pouvez parcourir la structure PDF interne dans Adobe Acrobat à l'aide de sa Browse Internal PDF Structure
commande du plugin Preflight:
http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/
Vous pouvez également utiliser le plugin PDF CanOpener commercial pour Acrobat pour voir la structure de l'objet ou PDFedit gratuit pour décoder les flux de données compressés en PDF.
PoDoFoBrowser est un petit utilitaire portable gratuit qui permet non seulement de parcourir la structure PDF interne mais également d'exporter, d'importer et de modifier les données d'objets. Il peut être téléchargé ici:
http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/
Voici à quoi cela ressemble sous Windows:
L' éditeur PDF-XChange gratuit dispose d'un panneau Contenu qui vous permet de visualiser l'arborescence du fichier PDF.
View -> Panes -> Content
PDF Le campagnol semble rompu. Si quelqu'un est toujours à la recherche d'un outil, j'utilise l' analyseur PDF gratuit .
PDF Vole
le lien semble rompu maintenant ...