J'ai parcouru cet article dans mes actualités SEO aujourd'hui. Cela semble impliquer que vous pouvez utiliser des Noindex:directives en plus des Disallow:directives standard dans robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Il semble que cela empêcherait les moteurs de recherche d'explorer la page un et les empêcherait d'indexer la page deux.
Cette directive robots.txt est-elle prise en charge par Google et d'autres moteurs de recherche? Est-ce que ça marche? Est-ce documenté?
disallowGoogle empêche de découvrir des liens sur les pages parent et enfant, le cas échéant. Bien qu'il noindexarrête simplement la liste de la page, il n'interrompt pas la découverte tandis que l'interdiction le fait.
nofollowmarche pour les balises META. Ce serait bien de savoir si c'est aussi le cas pour robots.txt .
<a rel="no-follow">aussi. Je ne vois aucune raison pour laquelle il serait traité différemment. Évidemment, ce n'est pas officiel et il est même recommandé par John Muller de ne pas l'utiliser dans le robots.txt mais à part son tweet, je n'ai pas réussi à trouver beaucoup d'informations à ce sujet.
Noindexdirective dans les robots.txtfichiers comme une erreur.