Qu'est-ce qui peut provoquer «Découvert - actuellement non indexé» dans le nouveau GWT


18

Le nouveau GWT affiche les liens des plans de site divisés en nouvelles catégories. Deux qui me confondent: 1. Découvert - actuellement non indexé 2. Analysé - actuellement non indexé

Quelles en sont les raisons possibles et y a-t-il des implications à l'échelle du site? Est-ce un signe de Google que je devrais envisager de supprimer?

entrez la description de l'image ici

Réponses:


11

Cela fait partie du processus. Il n'y a rien à faire jusqu'à ce que vous obteniez réellement des erreurs .

Pour comprendre les catégories, vous devez comprendre le fonctionnement de l'indexation, ce qui se fait pratiquement en continu:

  • Googlebot récupère une page, ce qui signifie télécharger son contenu sur les serveurs Google. Lorsque cela se produit, la page est explorée .
  • Il place ensuite le contenu de la page téléchargée dans l'index. Cela signifie que la page est indexée .
  • Lors de l'exploration de la page, il les trouve et les place dans une file d'attente. Ces liens sont découverts .

Donc:

  • Découvert non indexé signifie que le lien a été ajouté à la file d'attente d'éléments que Googlebot peut éventuellement explorer. Étant donné que le Web est pratiquement infini et qu'il existe une priorité, il se peut qu'il n'y arrive jamais.
  • L'analyse non indexée actuellement signifie que la page a été téléchargée sur les serveurs Google, mais que son contenu n'a pas été inséré dans l'index.

1
J'ajouterais que Google décide quoi explorer en fonction du PageRank. Un lien vers une page plus souvent ou plus en évidence (même en interne) peut permettre à Googlebot de l'explorer.
Stephen Ostermiller

3
Je pense que "non indexé actuellement" pourrait également signifier que Google choisit de ne pas l'indexer. Il peut être dupliqué ou de mauvaise qualité. Il pourrait ne pas avoir assez de Pagerank. Google pourrait penser qu'il ne correspondra pas à suffisamment de recherches.
Stephen Ostermiller

C'est ce que je faisais allusion à la priorisation . Cela se produit avec des liens soupçonnés d'être des doublons (parfois parce qu'ils diffèrent uniquement sur un paramètre ou correspondent à un autre canonique).
Itai

Les pages tombent dans et hors de "Crawled non indexé actuellement" sans aucune attention de ma part. L'information est également douteuse. Exemple: une URL inspectée génère un message indiquant qu'elle est indexée, mais pas dans aucun plan du site ... la page est dans le plan du site et existe depuis des années. La récente mise à jour d'algo a envoyé ce rapport ici et là.
GLCoder

3

Google peut découvrir et explorer vos pages, mais cela ne signifie pas qu'il les indexera nécessairement.

Il existe de nombreuses raisons pour lesquelles Google peut ne pas indexer une page. Il a peut-être trouvé un contenu en double. Il ne pense peut-être pas qu'il offre suffisamment de valeur pour des requêtes de recherche spécifiques. Google a peut-être trouvé quelque chose sur votre page qu'il n'aime pas.

Quelle qu'en soit la raison, Google n'a tout simplement pas décidé d'indexer certaines des pages qu'il a découvertes et explorées sur votre site. Il est assez normal que certaines de vos pages ne soient pas indexées. Certaines pages de mes sites ne sont pas indexées malgré le fait qu'elles aient un meilleur contenu que de nombreuses pages indexées et qu'elles contiennent une quantité substantielle de liens internes. Le système d'indexation de Google est un algorithme d'apprentissage automatique. Il peut donc décider de ne pas indexer certaines pages parfois pour diverses raisons inconnues.


1
"Peut-être a-t-il trouvé un contenu en double"> Je voudrais ajouter que dans ce cas cependant, puisque le message est "Découvert - actuellement non indexé", cela indique que la page n'a même pas été récupérée (ou elle serait "Crawled" - actuellement non indexé "). Donc, à ce stade, ils ne savent rien de son contenu. Je suppose donc que la hiérarchisation à ce stade dépend de l'URL elle-même, du nombre de pages qui y relient, et possibiy d'autres choses.
Niavlys

2

Googlebot a sa propre file d'attente, basée sur différents paramètres. C'est le message à propos de ces URL qui sont même mises en file d'attente.

entrez la description de l'image ici

Aj Cohn a une sorte d'opinion amusante sur la signification de ce message:

Découvert - actuellement non indexé semble indiquer qu'ils le voient dans votre plan du site, mais en fonction de l'apparence des autres contenus, ils ne vont même pas prendre la peine de l'explorer. Essentiellement, "Ya laid!" Ou, peut-être que c'est juste une représentation de la mauvaise efficacité de l'analyse.

Franchement, je ne suis pas tout à fait sûr que la définition de Découvert est exacte, car la plupart des exemples d'URL sous ce statut ont une dernière date analysée. Cela semble contredire la définition fournie.


2
J'ai supprimé le bit "lire le manuel". Ce n'est pas utile. D'autant plus que la documentation de Google est assez pauvre.
Stephen Ostermiller

0

Même si Google a découvert l'URL, il n'a pas estimé qu'il était suffisamment important pour passer du temps à explorer. Si vous souhaitez que cette page reçoive du trafic de recherche organique, envisagez de créer un lien vers celle-ci depuis votre propre site Web. Assurez-vous de promouvoir ce contenu auprès des autres dans l'espoir de pouvoir gagner des backlinks à partir de sites Web externes. Les liens externes vers votre contenu indiquent à Google qu'une page est précieuse et considérée comme fiable, ce qui augmente ses chances d'être indexée.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.