Réponses:
La dernière version de k2pdfopt peut conserver l’OCR avec l’ option de sortie PDF native (-mode 2col) ou restaurer l’OCR à l’aide de son propre OCR . Par ailleurs, l’exécution de la sortie k2pdfopt via Caliber, comme certains l’ont suggéré, n’est pas nécessaire si vous utilisez les paramètres corrects dans k2pdfopt.
Edit: La version v2.x de k2pdfopt, publiée le 3 sept. 2013, conservera le texte précédemment OCR par défaut même lorsqu'il n'est pas utilisé en mode de sortie PDF natif (par exemple, lors du redimensionnement de texte).
Trouvé ce guide. Fondamentalement, utiliser k2pdfopt pour convertir les deux colonnes en une seule. Et puis cela passe par Calibre pour une version plus propre.
Ceci est une solution partielle car elle supprime les avantages de l'OCR. Le fichier résultant est uniquement des images et donc très volumineux.