La page apparaît indexée dans Google mais introuvable pour les termes de recherche?


27

(Notez que je vais utiliser des captures d'écran ici parce que je soupçonne que l'écriture à ce sujet changera le comportement au fil du temps.)

Si vous effectuez une recherche Google pour

meilleures pratiques uiviewcontroller

avec ou sans les guillemets, vous obtenez des résultats comme celui-ci:

texte alternatif

texte alternatif

Notez qu'aucune de ces pages ne se résout à la question de débordement de pile contenant ces mots dans le titre . Ils résolvent soit a) des sites qui reflètent nos données Creative Commons et pointent correctement vers la question source sans nofollow, comme spécifié correctement par nos exigences d'attribution ou b) nos propres liens internes vers la question, mais pas la vraie question elle-même.

La page actuelle avec le titre ...

Meilleures pratiques UIView et UIViewController personnalisées?

... n'existe à l'adresse ...

http://stackoverflow.com/questions/3300183/custom-uiview-and-uiviewcontroller-best-practices

... et apparemment il est présent dans l'index de Google!

texte alternatif

Mais pourquoi n'apparaît-il pas lorsque nous recherchons

meilleures pratiques uiviewcontroller

?

Nous savons que

Je ne comprends pas. Que faisons-nous de mal ici?


9
@Jeff Atwood J'ai remarqué que d'autres sites qui reflètent le contenu de Stack Overflow arrivent avant Stack Overflow dans les recherches de questions. Je ne sais pas ce qui en est la cause, mais cela ne me donne pas un effet flou.
George Stocker,

Vous n'avez peut-être pas payé votre facture Google ce mois-ci. Je me demande si c'est lié au contenu ... y a-t-il des mots vides dans l'une des annonces qui ont été affichées lorsque la page a été indexée?
Webjedi

1
@george c'est le problème ci-dessus, ou la page n'est pas du tout indexée.
Jeff Atwood

1
Il y a peut-être une erreur dans votre plan du site, mais je ne le vois pas, car Stackoverflow bloque l'accès du plan du site aux moteurs de recherche. Pourriez-vous ajouter l'extrait pertinent de votre plan du site à la question?
Dan Fabulich

Le plan du site @dan n'est pas pertinent ici; voir webmasters.stackexchange.com/questions/4803/the-sitemap-paradox - mais vous pouvez supposer que c'était dans le plan du site des 50 000 dernières questions actives au moment où il a été posé.
Jeff Atwood

Réponses:


12

Il n'y a pas grand chose à faire à ce sujet. Il y a un peu d'adolescent que vous pouvez faire pour aider, mais le problème est endémique à l'index de Google.

  • Il n'y a pas qu'un seul "index" Google c'est éclaté. Les pages avec un PageRank faible apparaissent en très peu d'éclats. L'utilisation site:stackoverflow.comforce votre requête sur un fragment qui a une plus grande fraction de vos URL indexées. Cela explique les résultats contradictoires que vous voyez: les résultats de la recherche proviennent de différents fragments.
  • Le PageRank s'applique aux pages , pas aux domaines. Oui vraiment. Étant donné que la page d'accueil StackOverflow a un PageRank élevé, la page d'accueil peut transférer le PageRank vers d'autres pages de questions, mais si votre page d'accueil n'est pas liée à cette page de question particulière, le PageRank effectif de la question est très faible.
  • Vous pouvez également transférer le PageRank via votre sitemap XML. Selon cet article :

    La racine du domaine est supposée contenir un lien implicite vers le fichier Sitemaps. De plus, le fichier Sitemaps est supposé contenir des liens vers toutes ses URL, soit uniformément pondérés, soit pondérés par priorité si ce champ est fourni. Sur ce graphique augmenté, le PageRank peut être calculé pour chaque URL de la page Sitemaps.

  • StackOverflow n'est pas lié à toutes les questions sur le site; il n'est lié qu'à une infime minorité de questions pendant une très courte période. De plus, je crois comprendre que vous supprimez même des liens de votre plan du site, ne vous liant qu'aux questions les plus récentes. De nombreuses pages du site ne bénéficient pas du très haut PageRank de la page d'accueil.

Ainsi, vous pouvez résoudre ce problème un peu en vous assurant que votre plan de site XML est complet à 100% (pas seulement les dernières questions, mais TOUS) et en vous assurant que chaque page de question peut être atteinte par une courte chaîne de liens commençant depuis la page d'accueil.

Mais même cela ne fonctionnera pas toujours; vous ne pouvez pas raisonnablement vous attendre à ce que chaque page de votre site ait un PageRank élevé. Dans ces cas, ces pages seront explorées, mais n'apparaîtront probablement pas sur de nombreux fragments, donc Google ne les retournera pas toujours.

Bonne chance!

EDIT: Jeff déteste les plans de site, j'ai donc mis à jour cette réponse pour qu'il soit plus facile à lire.


1
C'est une autre bonne raison d'avoir un plan du site répondant ainsi à webmasters.stackexchange.com/questions/4803/the-sitemap-paradox
Adam

1
Je ne pourrais pas être plus en désaccord avec les sitemaps w / r / t; aucune des données empiriques dont nous disposons ne le confirme. Si Google ne peut pas contrôler votre site, le plan du site ne vaut rien. Cependant, Google devrait pouvoir questions?page=1passer au travers questions?page=9999et jusqu'à il y a environ 2 semaines, cela leur était explicitement supprimé en faveur du plan du site (qui, euh, ne fonctionnait pas).
Jeff Atwood

1
@dan, même pour les sites qui s'inscrivent dans le plan du site (par exemple, ils ont moins de 50 000 questions), nous avons vu ce phénomène sans importance accordée aux liens. Vous donnez des conseils dangereux et incorrects - d'après mon expérience - avec le plan du site. En plus de cela, vous pouvez clairement voir DANS LES CAPTURES D'ÉCRAN QUE J'AI PUBLIÉE que nous lions à cette question, sur plusieurs pages! Regardez de plus près ... i.imgur.com/PfyMz.png
Jeff Atwood

2
@Jeff Allez-y et ignorez tout ce que j'ai dit sur les plans de site. Je pense que c'est une erreur, mais c'est une petite erreur; peu de mal fait. Au lieu de cela, veuillez mettre à jour votre message avec la chaîne de liens de votre page d'accueil vers cette page de question. Astuce: si cela passe par questions?page=5et puis ?page=10et puis ?page=15, ce n'est probablement pas une chaîne très courte; c'est un problème pour toi.
Dan Fabulich

2
@Dan Je soupçonne que vous y êtes, si la page d'accueil du site ne renvoie pas directement à la page, vous dites à Google que cette page n'est pas importante. Si cette page est importante, obtenez un lien vers celle-ci :) Pour des sites comme celui-ci, nous avons vraiment besoin d'un outil pour répondre à la question: à quelle distance de la page d'accueil se trouve une page donnée, et à quoi ressemble le graphique de liens du site.
Alex Black

2

Je ne sais pas si cela fait une différence, mais en regardant le code source de la page efreedom, j'ai remarqué qu'ils utilisent les marqueurs google_ad_section_start et google_ad_section_end ( http://www.google.com/support/adsense/bin/answer.py?hl = en & réponse = 23168 ). Cela pourrait-il permettre à Google de mieux peser le contenu réel du site?

De plus, le contenu réel semble être plus proche du haut de la page, alors qu'avec SO, il y a beaucoup de cérémonie avant le contenu réel (cela peut ne pas avoir d'importance non plus, juste une supposition).


0

Réponse très courte et super facile. Ping la question.

Je travaille dans le SEO, et c'est comme ça que je gagne mes dizaines de dollars par an;) ... les choses apparaissent dans le grand G.

J'ai dépensé des milliers et des milliers de dollars en travaillant sur des outils qui accélèrent tout cela pour moi.

2 choses vous font apparaître avant le reste (pour des phrases exactes)

  1. Araignée rampe
  2. Liens entrants

Envoyez une requête ping à la page, envoyez une requête ping au plan du site et laissez les miroirs vous renvoyer vers ... vous placer "en permanence".

MODIFIER

Pour plus de clarté, voici un PDF sur les différents robots Google http://www.telezent.com/telezent/Resources/FAMILY-OF-GOOGLE-CRAWLERS.pdf


3
que signifie ping'ing sur une page?
Peter Mortensen

0

Un aspect important du référencement est le schéma de liens internes de votre site - les liens internes affectent à la fois l'araignabilité et la pondération des pages de votre site.

L'une des lignes directrices pour les liens internes est que les pages ne doivent pas contenir plus de ~ 100 liens - plus de 100 commencent à avoir l'air spammés (pour un robot) et diluent la valeur de chaque lien au point où chaque lien n'est pas très précieux du tout, même si vous créez un lien à partir d'une page de haute autorité.

Il est intéressant de noter que la page d'accueil de Stack Overflow contient environ 700 liens dans son code source, alors qu'Efreedom n'en a qu'environ 35. Les pages de sujet individuelles sur SO ont plus de 100 liens, tandis qu'Efreedom n'en a qu'environ 30.

Cela étant dit, l'index Google qui me sert les résultats semble bien faire les choses, avec SO en tête (au moins pour les 10 recherches que j'ai essayées).


0

Je me demande s'il y a un problème spécifique à l'emplacement ici?

Depuis mon bureau dans le centre de Londres (la version britannique), je viens de googler uiviewcontroller best practiceset les trois premiers résultats étaient SO, avec un seul lien efreedom au n ° 4. C'est une recherche google.co.uk .

En général, je pense que je vois des liens SO plus haut dans les résultats de recherche de Google - je ne connaissais pas du tout eFreedom avant aujourd'hui.

Je note que l'entrée eFreedom d'Alexa l' a à # 568 pour l'Inde - peut-être y a-t-il un parti pris particulier avec les recherches basées en Inde?


Je suggère que Google ait mis à jour son index plusieurs fois depuis que la question a été posée il y a près d'un mois.
MrG
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.