Je travaille sur un site Web qui offrira un contenu localisé suivant l' language+region
approche décrite sur cette page W3.org (par exemple fr-CA
pour le contenu canadien français et fr-FR
pour le contenu "français français"). Comme nous considérons le contenu de chacun language+region
comme unique, il est crucial pour nous que les moteurs de recherche identifient et diffusent correctement le contenu en conséquence.
En recherchant sur Internet (par exemple cette question ), il semble que la plupart des gens recommandent l'utilisation d'un code de langue ISO639 dans l' lang
attribut HTML pour décrire la langue du contenu. Suite à cette recommandation, nous utiliserions <html lang="fr">
ce qui ne permettrait pas la différenciation entre les language+region
combinaisons susmentionnées .
Lors de l'examen de la spécification HTML4 , il semble que l'utilisation language+region
comme code de langue serait parfaitement OK, car l' en-US
exemple est donné comme une valeur possible. Cependant, je n'ai trouvé aucune confirmation de cela dans la spécification HTML5 qui ne semble pas fournir d'exemple quant aux valeurs autorisées possibles.
De là, j'ai essayé d'obtenir une réponse de facto en regardant ce que faisaient les géants du Web. J'ai regardé ce que Facebook fait: ils proposent des versions Candian français et français français de leurs sites Web avec un contenu (légèrement) différent, tandis que la lang
valeur HTML reste la même:
fr-CA
URL: http://fr-ca.facebook.com
Attribut HTML lang: <html lang="fr">
traduction du mot 'email':courriel
fr-FR
URL: http://fr-fr.facebook.com/
Attribut HTML lang: <html lang="fr">
traduction du mot 'email':Adresse électronique
Quelle est la manière recommandée / standard de décrire le contenu localisé en utilisant l' language+region
approche en HTML5?