Edit: Résumé
Apparemment, le caractère à afficher dans ce cas est un "tiret".
Cette page contient un tableau à mi-chemin qui indique que, pour –
certains, un logiciel convertira le code hexadécimal correct de 2013 en 0096. (regardez la première ligne du tableau).
Cette réponse sur Stackoverflow explique qu'il s'agit en quelque sorte d'un mélange entre Windows-1252 et UTF-8.
Cet article de blog impose ceci:
Le caractère 150 (0x96) est le caractère unicode "START OF GUARDED AREA" dans la plage de caractères de contrôle C1 non affichée, mais dans l'encodage Windows-1252, il est mappé sur le caractère affichable 0x2013 "en-tiret" (un tiret court). .
D'autres ont eu du mal à produire ce contenu, car cette réponse sur Stackoverflow montre comment remplacer 0x0096 par 0x2013.
Google doit en être conscient, car, comme indiqué dans la question initiale ci-dessous, la version mise en cache de la page Amazon par Google –
semble donc corriger automatiquement ces erreurs sur les pages mises en cache.
J'ai essayé de régler mon encodage sur Windows-1252, mais cela n'aide pas.
Alors maintenant, je suppose que ma question est la suivante: comment puis-je dire à Firefox d’ignorer des caractères non imprimables comme ceux-ci?
Contenu original ci-dessous:
(Firefox 3.6.13 sur Windows XP)
De temps en temps, je remarque un caractère étrange sur certaines pages Web lors de la navigation sur le Web. C'est le contour d'une boîte avec un nombre à 4 chiffres à l'intérieur.
Voici un exemple de page comportant ces caractères: http://aws.amazon.com/ec2/#highlights
Après chaque en-tête de section (Élastique, Complètement contrôlé, ...), je vois une boîte avec le numéro "0096" à l'intérieur. J'ai consulté la version mise en cache sur Google et Google l'a –
remplacée. J'imagine que je devrais y voir un tiret au lieu de la zone contenant les chiffres.
J'ai essayé de changer l'encodage des caractères dans Firefox, mais je n'ai pas réussi à en trouver un qui affiche correctement ces caractères.
Existe-t-il un moyen d'autoriser Firefox à visualiser ces caractères?
Merci d'avance!
Modifier - ajout d'une capture d'écran des caractères "spéciaux":
Edit # 2 - essayé dans Ubuntu - nouvelles images
Je me suis connecté à mon bureau Ubuntu et j'ai consulté la page amazon dans Chrome et Firefox. Chrome ignore complètement le caractère, même si j'inspecte ou visualise le code source de la page. Firefox dans Unbutu affiche le caractère exactement comme Firefox sur ma machine Windows XP. J'ai copié le personnage et joué avec elle sur la ligne de commande - voici une capture d'écran des résultats:
On dirait que je peux aussi coller le personnage dans ce post:
Ce n'est certainement pas isolé à Windows XP. J'ai essayé de définir l'encodage des caractères de mon terminal sur Windows 1252 (d'après le commentaire de Dennis ci-dessous), mais il n'affiche alors que ce caractère sous forme de point d'interrogation.
J'ai abaissé la page Web avec wget et curl, et les deux sorties affichent les caractères suivants: <96>
Je me demande si ce personnage rend correctement pour quelqu'un? Il semble que Webkit l'ignore simplement, mon IE6 l'ignore, Firefox affiche la boîte avec les chiffres. J'aurais dû imaginer que l'équipe de conception d'Amazon puisse le voir correctement?
Ce n’est pas un gros problème que ces personnages s’affiche correctement, mais il serait bon de savoir s’il existe une solution à ce problème.
–
0xc296
, mais j'ai peut-être commis une erreur lors de la copie.
–
es. Ne voyez-vous que la boîte dans la copie en cache à laquelle vous ne créez pas de lien, ou également sur la page en direct?