Les moteurs de recherche explorent-ils les PDF et, dans l'affirmative, y a-t-il des règles à suivre lors de leur création?


22

Le site Web sur lequel je travaille contient quelques centaines de PDF. Je ne pense pas avoir vu aucun d'entre eux revenir dans une recherche, mais il y a des liens vers directement depuis notre site. Ils sont également pleins de mots-clés car ce sont des documents produits.

Y a-t-il quelque chose de spécial que nous devons faire pour que Google ou d'autres moteurs de recherche les explorent?

Existe-t-il des règles strictes et rapides pour créer des PDF pour aider Google à les apprécier davantage? Par exemple, dois-je les exécuter via ghostscript pour nettoyer les balises PDF cassées qu'Adobe crée lors de la génération?


Ajouter à votre sitemap xml pour vous assurer qu'ils en sont conscients?
artlung

Réponses:


17

Google indexe définitivement les fichiers PDF et vous pouvez rechercher uniquement des fichiers PDF en les ajoutant filetype:pdfà votre requête de recherche ( exemple ).

Je dirais que les principales choses à faire pour optimiser un PDF afin qu'il soit facilement indexé seraient:

  • Donnez-lui un nom de fichier significatif
  • Complétez toutes les propriétés des métadonnées du document (titre, auteur, mots-clés, etc.)
  • Assurez-vous que votre PDF est composé de texte réel et non d'images numérisées
  • Assurez-vous d'avoir un bon contenu avec une utilisation correcte des en-têtes, tout comme vous le feriez pour un document HTML

Pour plus de conseils, lisez Optimisation des documents PDF et onze conseils pour l'optimisation des PDF pour les moteurs de recherche.



@Christofian Thanks - J'ai mis à jour le lien. Je laisse au lecteur le soin d'apprécier l'ironie d'une société de référencement renommant leurs liens sans avoir de redirection 301!
Dan Diplo

@DanDiplo en ce qui concerne le référencement des fichiers PDF, je suggère d'ajouter un lien dans le contenu, le cas échéant.
Anagio

1

Je ne suis pas sûr des autres moteurs de recherche, mais en ce qui concerne Google, la règle principale serait de ne pas les exclure via robots.txt

C'était leur première annonce de soutien à la recherche PDF.


1

Tout comme rendre un site Web conforme ne peut pas nuire à votre référencement, rendre votre PDF accessible ne peut pas nuire. Le vérificateur d'accessibilité intégré d'Adobe est loin d'être parfait, mais au moins la correction de ces zones vous permettra de démarrer.

Je passe probablement 5 minutes sur chacun des 4 ou 5, principalement des PDF texte que nous mettons en ligne. Le temps augmente uniformément en fonction du nombre de pages et de la complexité de ces pages.

En supposant que vous disposez d'Adobe Acrobat Pro pour effectuer vos modifications:

  • Exécutez une vérification complète de l'accessibilité. (La vérification rapide est assez inutile pour moi)
  • Mettre à jour les méta-informations dans les propriétés du document (mots-clés, sujet, langue, etc.)
  • Assurez-vous que les balises sont ajoutées
  • Assurez-vous que le texte est marqué comme du texte, des images comme des images, des trucs d'arrière-plan comme arrière-plan
  • Marquer les peluches inutiles (comme la décoration ou le design) comme arrière-plan
  • Ajoutez un bon texte alternatif aux images
  • Assurez-vous que dans l'ordre de lecture, le texte est correctement ordonné
  • Dans la barre d'outils de contenu, assurez-vous que le texte n'est pas dupliqué ou mal traduit
  • Utiliser le scanner OCR sur les pages numérisées

Pour une édition plus avancée comme des tableaux et des erreurs Adobe vraiment bizarres, nous utilisons un plugin appelé CommonLook. CommonLook fait le travail, mais je déteste presque autant que je déteste les outils Adobe.

Familiarisez-vous avec l'outil Retouche Ordre de lecture, la barre d'outils Balises, la barre d'outils Ordre de lecture et la barre d'outils Contenu. Mon travail nécessite des documents entièrement conformes avant de sortir sur le Web, mais n'importe qui pourrait bénéficier de quelques propriétés simples de balisage et de document.


Notre site contenait plus de 5 000 PDF que nous devions revenir en arrière et mettre en conformité complète avec 508. Il a fallu un certain temps pour apprendre, le formateur suggéré par Adobe n'a pas aidé, mais une fois que vous l'avez appris, vous pouvez vraiment les compresser.
MrChrister
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.