Mise à jour : les œuvres suivantes, elle s'imprime <meta name="robots" content="noindex,follow" />
dans la section tête de toutes les pages accessibles via un chemin commençant par comment
. C'est pour contourner le fait qu'une page comme comment / 3 porte en interne node / nid comme arguments, comme jmarkel l'a souligné ci-dessus.
<?php
function metarobots_comment_help() {
$url_components = explode('/', request_uri());
if ($url_components[1] == 'comment') {
$elements = array(
'#tag' => 'meta',
'#attributes' => array(
'name' => 'robots',
'content' => 'noindex,follow',
),
);
drupal_add_html_head($elements, 'robots');
}
}
À l'aide d'un commentaire utile sur la fonction arg .
Espérons que cela sera éventuellement traité par le module Meta Tags - il y a une demande de fonctionnalité , mais il n'est pas encore clair si l'auteur du module souhaite prendre en charge cela.
[Mon commentaire précédent] Je voulais juste ajouter que l'utilisation de robots.txt n'est pas la réponse - comme vous l'avez déjà remarqué, les liens continuent d'apparaître dans les résultats de recherche malgré l'utilisation Disallow: /comment
. Cela est attendu, car robots.txt indique au bot de ne pas explorer ces pages, mais il ne dit pas à Google de ne pas l'indexer. Comme expliqué sur SEOmoz Robots.txt et Meta Robots Best Practices for Search Engine Optimization :
Dans la plupart des cas, les méta robots avec les paramètres "noindex, follow" doivent être utilisés comme moyen de restreindre l'exploration ou l'indexation.
Bloquer avec Robots.txt - Cela indique aux moteurs de ne pas explorer l'URL donnée mais leur dit qu'ils peuvent conserver la page dans l'index et l'afficher dans les résultats.
Bloquer avec Meta NoIndex - Cela indique aux moteurs qu'ils peuvent visiter mais ils ne sont pas autorisés à afficher l'URL dans les résultats. (C'est la méthode recommandée) Donc, la balise META noindex que vous recherchez est en effet ce dont vous avez besoin.
robots.txt
dossier?