J'ai vu cette question sur la proposition de site Typography et cela m'a dérangé que je ne connaissais pas la réponse. J'avais toujours traité «glyphe» et «personnage» comme interchangeables.
Après avoir lu une explication sur la page Modèle de codage de caractères Unicode , ma compréhension est à peu près la suivante:
- Les caractères sont définis par leur signification dans la langue, les glyphes, par leur apparence . Ainsi, la ligature pour combiner esthétiquement
fi
est un glyphe, mais deux caractères.
Donc, ma conviction est (veuillez me corriger si je me trompe) que la différence pratique serait:
- Les analyseurs de texte qui ne sont pas intéressés par l'esthétique du texte liront les glyphes comme leurs caractères respectifs. Alors:
- Si vous deviez copier et coller du texte contenant des glyphes dans un éditeur de texte brut, les glyphes seraient convertis en leurs caractères respectifs (un
fi
glyphe de ligature deviendraitf
eti
) - Tout système automatisé bien conçu basé sur l'analyse de texte (par exemple, les robots des moteurs de recherche, les lecteurs d'écran, les correcteurs orthographiques) interpréterait les glyphes comme leurs caractères respectifs.
- Un personnage peut avoir plusieurs glyphes ou jeux de glyphes. Je veux dire qu'un glyphe ne peut avoir qu'un seul caractère, mais ce n'est clairement pas correct car il y a un exemple sur l'article lié de 3 glyphes et ensembles de glyphes qui semblent correspondre chacun à un caractère et à un ensemble de caractères. Je ne vois pas vraiment comment cela pourrait fonctionner: cela signifie sûrement qu'il y aura une incohérence ou une ambiguïté dans la façon dont ces glyphes sont interprétés, variant selon l'interprète? (ou varie-t-il selon la langue ou la police?)
- Alors que les navigateurs de glyphes (par exemple celui d'Illustrator) contiennent l'ensemble complet de glyphes d'une police, les cartes de caractères (par exemple la carte de caractères Windows) ne contiennent que des caractères, pas des glyphes qui sont plusieurs caractères comme des ligatures (quelque chose que je n'avais pas remarqué auparavant)
- Si vous deviez copier et coller du texte contenant des glyphes dans un éditeur de texte brut, les glyphes seraient convertis en leurs caractères respectifs (un
Je sens que j'y suis presque, mais j'ai clairement mal compris quelque chose le long de la ligne: pas seulement la chose "Un glyphe à plusieurs caractères", mais aussi, copier et coller un comportement avec des ligatures n'est pas tout à fait ce que j'attendais:
- Copiez la ligature
fi
d'Illustrator dans cette zone de saisie: colle commefi
(deux caractères) comme prévu. - Collez le code HTML pour cela (
fi
) - s'affiche comme la ligature lorsqu'il n'est pas dans un bloc de code (fi - qui dans cette police ne ressemble pas beaucoup à une ligature, mais vous en verrez une si vous essayez de sélectionner seulement la moitié de celui-ci), et le code dans un bloc de code (fi
), comme prévu. - Copiez et collez la ligature non bloquée rendue dans la zone de saisie: colle comme caractère de ligature et restitue comme ligature, qu'elle soit ou non dans un bloc de code (fi et
fi
). De même, les mots qui le contiennent: fit fit mists (fit misfits
) colle comme fit fit mists (fit misfits
). Peut-être que cela dépend si l'endroit où il est collé comprend le codage utilisé?
Dans quelle mesure ma compréhension de cela est-elle erronée? Quelqu'un peut-il me corriger: énoncer une définition claire de la différence entre les glyphes et les caractères (si le mien est faux ou peut être amélioré), et donner des exemples plus clairs / plus précis que le mien de ce que cela signifie dans la pratique ?