Configuration appropriée de sitemap.xml


11

J'ai un site dynamique qui compte de nombreux (enfin, moins de 50) utilisateurs. Chaque utilisateur est autorisé à créer autant de pages qu'il le souhaite. Je sais qu'il y a une limite au nombre de pages que vous pouvez répertorier dans sitemap.xml, et pour l'instant je suis sous cette limite, mais j'aimerais savoir quelle est la meilleure façon de permettre aux moteurs de recherche de tout savoir les pages de mes utilisateurs tout en restant sous cette limite même si j'ai plus que la limite.

Réponses:


11

Limites du plan du site:

Les fichiers de plan de site ont une limite de 50 000 URL et 10 mégaoctets par plan de site. Les plans de site peuvent être compressés à l'aide de gzip, ce qui réduit la consommation de bande passante. Plusieurs fichiers de sitemaps sont pris en charge, avec un fichier d'index de sitemaps servant de point d'entrée pour un total de 1000 sitemaps.

Notez que vous pouvez spécifier plusieurs plans de site dans votre fichier robots.txt :

Si vous vous heurtez à la limitation, divisez peut-être vos utilisateurs d'une manière ou d'une autre. Disons que chacun de vos utilisateurs ne possède pas plus de 10 000 URL par morceau, vous pouvez le décomposer en fichiers et l'ajouter à votre robots.txtfichier:

Sitemap: http://www.example.com/sitemaps/users-001-005.xml
Sitemap: http://www.example.com/sitemaps/users-006-010.xml
Sitemap: http://www.example.com/sitemaps/users-011-015.xml
Sitemap: http://www.example.com/sitemaps/users-016-020.xml
Sitemap: http://www.example.com/sitemaps/users-021-025.xml
Sitemap: http://www.example.com/sitemaps/users-026-030.xml
Sitemap: http://www.example.com/sitemaps/users-031-035.xml
Sitemap: http://www.example.com/sitemaps/users-036-040.xml
Sitemap: http://www.example.com/sitemaps/users-041-045.xml
Sitemap: http://www.example.com/sitemaps/users-046-050.xml

Maintenant, vous devez toujours être conscient de la limite de 10 Mo pour chaque plan de site individuel, mais il s'agit d'une approche pour gérer le problème des "trop ​​nombreuses" URL.

Consultez les fichiers CNN et Google robots.txt pour voir plusieurs plans de site en action.


2
Remarque: la limite de 10 Mo est par plan de site, pas totale
Thomas Bonini

1
Il peut être utile de créer un lien vers le fichier Index du plan du site et de lui donner un exemple: sitemaps.org/protocol.php#index. Il est également utilisé par de nombreux sites et présente les avantages de l'exploration dans les outils Google pour les webmasters. Quelques exemples: nanaimo.ca/sitemap.xml barnonedrinks.com/sitemap.xml
JasonBirch

Quelqu'un a-t-il réellement vu un plan du site de 10 Mo? Yeowzerz!
Tim Post

Je n'ai pas vu de plan de site de 10 Mo, mais en voici un avec 50 000 URL: gstatic.com/dictionary/static/sitemaps/…
artlung

(trouvé en quelques minutes en parcourant certains plans de site pour cnn et google et quelques autres grands sites d'actualités / archives)
artlung
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.