J'ai besoin de récupérer des milliers d'extraits de texte de PDF dans une feuille de calcul. Ils sont courts, rarement plus de 2-3 lignes, mais chaque saut de ligne crée une nouvelle cellule, et je dois la réparer manuellement, ce qui coûte beaucoup de temps.
Étant donné que j'en ai tellement, l'utilisation de la solution de contournement "Coller dans Word et rechercher et remplacer" est tout simplement trop longue pour moi. Existe-t-il un moyen de faire disparaître le saut de ligne lors de la copie? Peut-être y a-t-il une visionneuse qui offre un mode de copie spécial pour cela, ou a un plugin?
Les documents sont des articles scientifiques. La disposition du texte est assez linéaire. Vous pouvez supposer que le texte que je copie n'est pas à l'intérieur d'un tableau ou d'un flotteur, et qu'il n'est pas tourné ou quoi que ce soit. (Si une telle chose se produit, je pense que je vais m'en occuper manuellement). Le texte est souvent défini sur deux colonnes, mais je n'ai aucun problème à marquer uniquement le texte dont j'ai besoin dans sa colonne. Je n'ai pas besoin de conserver de formatage spécial. Je suis prêt à essayer une solution qui supprime tous les caractères non imprimables, par exemple. Les textes sont en anglais, c'est OK si la solution ne fonctionne qu'en ASCII / enlève tous les ASCII non alphanumériques du texte copié.
J'ai une très forte préférence pour une solution qui fonctionnera sous Linux, éventuellement une sorte de plugin Okular. Mais s'il se trouve qu'il existe une solution Windows uniquement, je veux aussi en entendre parler. J'ai une licence pour un Acrobat Pro quelque peu récent sur la machine Windows.