Mon supérieur hiérarchique me demande généralement de remettre une sorte de rapport écrit. Je les écris dans LaTeX, les envoie au format PDF et les récupère avec beaucoup de commentaires. Elle utilise Acrobat Professional pour créer les commentaires.
Je souhaite extraire une liste de tous les commentaires du fichier afin de pouvoir, dans un deuxième temps, les importer dans un outil de gestion des tâches. Un simple format de texte suffira, je peux écrire un script pour ajouter du balisage si nécessaire. Tout ce que je veux, c'est que les commentaires individuels soient séparés d'une manière ou d'une autre, par exemple par deux lignes vierges (je pense qu'elle ajoute parfois des nouvelles lignes aux commentaires).
Je préfère fortement une solution qui fonctionne sous Linux, mais dans le pire des cas acceptera quelque chose qui nécessite Windows. Je n'ai pas de licence pour Acrobat Professional ou d'autres lecteurs PDF payants, alors merci de recommander un logiciel libre si possible.
libpdfbox-java
directement car ce programme s'appuie sur une ancienne version de pdfbox et ne tourne paspdfannotextractor --install
, b) le programme ne fonctionne pas vraiment (selon mon expérience) pour extraire des annotations en texte brut