En 2010, diffuseriez-vous des URL contenant des caractères UTF-8 dans un grand portail Web?
Les caractères Unicode sont interdits selon la RFC sur les URL (voir ici ). Ils devraient être codés en pourcentage pour être conformes aux normes.
Mon point principal, cependant, est de servir les caractères non codés dans le seul but d'avoir de belles URL, donc le codage en pourcentage est éliminé.
Tous les principaux navigateurs semblent analyser ces URL, peu importe ce que dit la RFC. Mon impression générale, cependant, est que cela devient très instable lorsque vous quittez le domaine des navigateurs Web:
- URL à copier-coller dans des fichiers texte, des courriels, même des sites Web avec un codage différent
- Bibliothèques clientes HTTP
- Navigateurs exotiques, lecteurs RSS
Mon impression est-elle correcte qu'il faut s'attendre à des problèmes ici, et donc ce n'est pas (encore) une solution pratique si vous servez un public non technique et qu'il est important que tous vos liens fonctionnent correctement même s'ils sont cités et transmis?
Existe-t-il un moyen magique de proposer de jolies URL en HTML?
http://www.example.com/düsseldorf?neighbourhood=Lörick
qui peut être copié + collé avec les caractères spéciaux intacts, mais fonctionne correctement lorsqu'il est réutilisé dans des clients plus anciens?