Existe-t-il un moyen pour que les moteurs de recherche n'indexent pas une certaine section d'une page?


13

J'ai configuré Blogger avec le panneau Archive du blog affiché sur chaque page afin que les utilisateurs puissent facilement accéder aux anciens messages. Le problème est qu'il répertorie le titre de chaque page de ce panneau, ce qui signifie que la page actuelle obtient des mots-clés qui ne lui sont pas directement liés mais à une page différente.

Par exemple, j'écris peut-être sur les oranges, mais il y a une semaine, j'écrivais sur les pommes. La page sur les oranges est maintenant vue par les moteurs de recherche pour parler également des pommes car il y a un lien dans le panneau Archive vers mon article d'il y a une semaine sur les pommes. L'inverse est également vrai lorsque la page des pommes indexe également les mots-clés orange.

Existe-t-il un moyen d'exclure une certaine section d'une page de l'indexation? (par exemple, comme avoir un tout <div>marqué noindexou quelque chose de similaire.)

Je sais que Blogger a la possibilité de supprimer le titre des pages dans le panneau d'archives, mais je préférerais qu'elles restent là pour que les utilisateurs sachent quels messages sont disponibles.


2
C'est juste un peu trop comme «camouflage» pour les goûts de nombreux moteurs de recherche pour masquer certaines parties d'une page. Convivialité: rencontrez des "experts seo chapeau noir" et les problèmes qu'ils créent pour le reste d'entre nous.
Tim Post

Ne pensez-vous pas que Google et les autres sont suffisamment intelligents pour reconnaître que ces liens ne sont pas du contenu principal mais plutôt des éléments de navigation? Ne pensez pas trop aux trucs;)
Seb

Réponses:


7

Soi-disant, vous pouvez ajouter la classe robots-nocontentaux éléments de votre page, comme ceci:

<div class="robots-nocontent">

    <p>Ignore this stuff.</p>

</div>

Yahoo respecte cela , mais je ne sais pas si d'autres moteurs de recherche le respectent. Il semble que Google ne le prenne pas en charge pour le moment. Je soupçonne que si vous chargez votre contenu via ajax, vous obtiendrez le même effet s'il n'est pas présent sur la page.


Ah oui, les mystérieuses balises <noindex> </noindex> qui n'ont pas non plus beaucoup de succès. Toutes les options se rapprochent un peu trop de l'utilisation d'un cloaker pour Google, par exemple :)
Tim Post

Pourquoi ne suis-je pas surpris que certains moteurs de recherche ne prennent pas en charge cela? J'aurais pensé que Google le ferait - "Ne sois pas méchant" et tout ça.
ChrisF

Ne pas indexer une partie d'une page est une étape supplémentaire, ce sont des données supplémentaires qui nécessitent une analyse, donc je trouve cela compréhensible, étant donné que ce n'est pas quelque chose que beaucoup de gens utilisent, que Google l'ignorerait. Cela ne me semble pas mauvais, juste pratique. C'est un "bien d'avoir" pas un "must have" dans mon esprit.
artlung

3

Il n'y a aucun moyen général de le faire et personnellement, je ne m'embêterais pas avec ça. Les moteurs de recherche sont assez bons pour reconnaître le contenu pertinent sur une page, et même si ce contenu peut apparaître dans les mots clés que les moteurs de recherche ont trouvés, cela ne signifie pas que cela rendrait la page pertinente pour ces mots clés.

Si vous avez une page sur "Fish" et une page sur "Dogs" (qui a le lien vers la page sur "Fish" quelque part dans la barre latérale), les moteurs de recherche pourront généralement reconnaître que la page sur "Fish" est beaucoup plus pertinent pour "Fish" que la page sur "Dogs" qui mentionne "Fish" dans la barre latérale. Il est possible que les deux pages soient trouvées à un moment donné, mais généralement, étant donné que la plupart des pages du site sont affichées dans les résultats de la recherche, cela ne vaut pas la peine de s'inquiéter.

Il n'est pas nécessaire d'être sophistiqué avec cela, et les moteurs de recherche sont susceptibles de devenir plus confus si vous essayez (par exemple, si vous utilisez JavaScript pour masquer le contenu, vous ne savez jamais quand les moteurs de recherche commenceront à trouver ce contenu malgré tout). De même, l'utilisation d'iframes avec robots.txt n'autorise pas ou AJAX dégradera fréquemment la qualité de vos pages pour les utilisateurs (ralentir ou les rendre moins utilisables sur une variété d'appareils), donc à moins qu'il n'y ait une raison très, très forte et prouvée que vous devez le faire, je vous recommande fortement de ne pas vous en préoccuper.


1

Je pense que vous pouvez utiliser un iFrame et le code qu'il contient ne sera indexé que si vous laissez Google indexer cette page. Donc, si vous mettez un nofollow dans votre fichier robots.txt pour le fichier qui est chargé depuis l'iFrame, vous devriez être ok.


0

Le texte du mot clé dans un lien est principalement appliqué à la page vers laquelle le lien pointe, et non à la page sur laquelle se trouve le lien. Personnellement, je ne m'en inquiéterais pas trop. Vous seriez probablement plus mal en supprimant / masquant les titres qu'en le laissant faire.


0

Google propose sa propre façon d' exclure le texte indésirable de l'index .

Dans votre exemple, vous avez parlé de l'ancre, que Google propose cet exemple:

<!--googleoff: anchor-->
  <A href=sharks_rugby.html>shark</A>
<!--googleon: anchor-->

Et il y a quelques autres modes.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.