J'ai un PDF existant (sans aucun fichier source correspondant) et un fichier texte qui est une liste d'éléments faisant référence à des sections dans le fichier PDF, ainsi qu'un numéro de page pour chaque élément. Je voudrais générer un nouveau PDF qui commence par un index de table des matières généré, suivi du contenu du PDF original. L'index généré doit être lié par un lien hypertexte pour que le fait de cliquer sur un élément passe automatiquement à la page contenant la section référencée.
Je recherche un ensemble d'outils approprié (de préférence orienté CLI) pour accomplir cela sous Linux; tous les outils que j'ai examinés jusqu'à présent ne semblent pas offrir de solution. Je suis un programmeur expérimenté et je suis plus qu'heureux d'écrire du code si nécessaire (de préférence en Ruby / Python / Perl / shell) pour analyser mon fichier texte et le convertir en index hyperlien, mais je ne trouve pas les bons outils pour le résoudre. Je pense qu'une partie du problème est que les hyperliens doivent pointer vers le même fichier, mais leurs cibles n'existeront que plus tard lorsque la ToC sera jointe au PDF d'origine.
Je suis également familier avec divers langages de balisage, par exemple Markdown, reStructuredText, TeX, LaTeX, org-mode, et une solution idéale utiliserait l'un d'entre eux comme étape intermédiaire pour générer le ToC hyperlien.