Sous Linux - Comment extraire du texte d'un texte .pdf
dans lequel le texte est vraiment du texte, pas une image numérisée? Je veux quelque chose que je peux utiliser sur la ligne de commande / dans un script, pas de manière interactive. (Je ne veux pas convertir .tif
et utiliser l'OCR - le texte est déjà disponible dans le .pdf
fichier, alors pourquoi introduire des inexactitudes de l'OCR imparfait?)