L'ouverture d'un PDF dans Illustrator divise les objets texte


10

J'ai récemment dû convertir certains PDFfichiers en SVG, et j'ai fait cela en ouvrant le PDF dans Illustrator et en l'enregistrant au format SVG.

Le problème était que lorsque Illustrator ouvrait le pdf, de nombreux (mais pas tous) objets texte étaient divisés en différents objets texte. Par exemple, le mot "politique" ne serait pas un objet texte, mais plutôt plusieurs objets texte, "po", "l", "glacé". Il ne semblait pas y avoir de rime ni de raison.

Comment puis-je empêcher que cela se produise?

Réponses:


11

Généralement, cela se produit pour maintenir l'apparence .

Si le texte interagit avec d'autres objets, il peut être rompu. Si la police incorporée dans le PDF est un sous-ensemble, plutôt que la police entière, elle peut être décomposée dans AI afin que AI puisse insérer les caractères manquants du sous-ensemble.

Il n'y a pas grand-chose que vous puissiez faire pour empêcher que cela ne se produise, à part travailler et enregistrer à chaque fois dans la même version d'Illustrator. Et seulement enregistrer un PDF en tant que fichier séparé pour la sortie, pas éditer.


Mais vous pouvez la corriger dans Illustrator en sélectionnant les chaînes de texte avec l' outil de sélection directe ou outil de sélection , Edit > Copypuis lancer un nouveau texte de point ou de la zone et Edit > Paste. Le texte collé sera une chaîne plutôt que les morceaux qui ont été copiés.


5
saints chats, je veux +10 cette réponse juste pour cette solution. Illustrator me rend fou avec ça depuis des ANNÉES.
Lauren-Clear-Monica-Ipsum

1
@LaurenIpsum Avez-vous vu la réponse ci-dessous? Encore plus incroyable, vraiment.
Chris K

8

Si vous souhaitez fusionner du texte cassé tout en préservant autant que possible la mise en forme, le placement, les paragraphes et toute autre typographie du texte existant, plutôt que de le coller dans une zone de texte nouvellement créée sous forme de texte brut, vous pouvez essayer John Wundes. incroyable script Join Text Frames .

Il fait exactement ce qu'il dit sur l'étain: il fusionne des extraits de texte en un seul extrait de texte, en faisant des jugements intelligents en fonction de leur position relative:

  • Il fusionne des extraits de texte adjacents (par exemple, à partir de lignes brisées de texte de fichiers PDF) en lignes simples, avec un certain contrôle offert sur la proximité considérée comme la même ligne.
  • Il fusionne des lignes de texte séparées en un seul objet texte multiligne avec le texte dans le bon ordre (de haut en bas), corrigeant les paragraphes brisés.
  • Il y a ensuite une option pour restaurer la mise en forme d'origine de tout le texte fusionné. Cela peut prendre un certain temps, mais cela vous donne des estimations assez précises du temps que cela prendra et la possibilité de sauter si cela n'en vaut pas la peine.

C'est vraiment bien!


Notez qu'il ne fonctionne que sur le texte ponctuel, pas sur le texte de zone (très bien ici car les PDF sont presque toujours du texte ponctuel). Si vous essayez de fusionner du texte de zone pour une raison quelconque, vous pouvez le convertir avec le script `` Créer un texte de point '' de Kelso Cartography


Il est également à portée de main est utilisé conjointement avec des AjarProductions de Convertir zone de texte manuscrit (Kelso Cartographie ont également un script similaire, voir le lien ci - dessus), si vous voulez revenir en arrière texte cassé dans dans les zones de texte appropriées avec les paragraphes écoulement automatique:

  1. Sélectionnez les extraits de texte rompus, exécutez le script Join Text Frames
  2. Copiez et collez le texte dans un éditeur de texte qui vous permet de trouver / remplacer des caractères de paragraphe (par exemple InDesign, l'éditeur de texte brut d'un codeur, ou peut-être même quelque chose comme ( chuchotements ) Word ...)
  3. Trouvez / remplacez les sauts de fin de ligne indésirables. S'il y a beaucoup de paragraphes séparés que vous souhaitez conserver, 1) êtes-vous sûr que vous ne feriez pas mieux d'utiliser InDesign? 2) vous pouvez le faire comme ceci:

    1. Rechercher / remplacer deux marqueurs de paragraphe consécutifs par un espace réservé de texte qui n'apparaît nulle part ailleurs dans le texte (par exemple \|\C.L.O.W.N.H.O.R.R.O.R/|/)
    2. Rechercher / remplacer des marqueurs de paragraphe par rien ou des espaces: le transformer en une longue ligne de texte avec des salves occasionnelles de \|\C.L.O.W.N.H.O.R.R.O.R/|/
    3. Rechercher / remplacer \|\C.L.O.W.N.H.O.R.R.O.R/|/pour un nouveau caractère de paragraphe - qui place un paragraphe là où deux se trouvaient auparavant.
  4. Copiez le texte et exécutez le script Convertir en zone de texte dessus. C'est maintenant une zone de texte fluide avec des sauts de paragraphe aux bons endroits.


Malheureusement, rien ne peut réparer le texte esquissé, à l'exception de l'empêcher d'être esquissé, de le retaper ou de faire confiance à un logiciel OCR potentiellement douteux.


Votre réponse est fantastique. J'ai cité et republié la première partie de votre réponse à ce QA: graphicdesign.stackexchange.com/a/105785/19447
Chris K
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.