Sous Linux - Comment extraire du texte d'un texte .pdfdans lequel le texte est vraiment du texte, pas une image numérisée? Je veux quelque chose que je peux utiliser sur la ligne de commande / dans un script, pas de manière interactive. (Je ne veux pas convertir .tifet utiliser l'OCR - le texte est déjà disponible dans le .pdffichier, alors pourquoi introduire des inexactitudes de l'OCR imparfait?)