Nous voyons certaines pages qui existent dans notre sitemap.xml
mais qui sont inexplicablement absentes de l'index de recherche publique de Google.
Vous ne pouvez pas télécharger /superuser//sitemap.xml - nous protégeons ce fichier car il y a eu des problèmes avec lui dans le passé - mais googlebot le peut. Nous avons vérifié via les outils Google pour les webmasters que le sitemap.xml
fichier a été retiré aujourd'hui et qu'il est classé OK sans erreur (coche verte).
Le sitemap.xml
contient une liste des 50 000 dernières questions posées sur notre site. Par exemple, cette question ...
/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links
... existe dans le sitemap.xml
as ...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
La recherche de "Comment voir la fin d'une longue chaîne de liens symboliques" ne donne qu'un seul résultat à questionhub.com qui gratte nos données (un tout autre problème).
Vous pouvez incrémenter le nombre de questions et effectuer une recherche exacte du titre de la question et vous verrez ce modèle persister.
Ces URL sont dans sitemap.xml mais elles n'apparaissent pas dans l'index de Google - et pourtant elles apparaissent sur des sites qui récupèrent nos données Creative Commons. Pourquoi serait-ce?