Pourquoi sur la première page, Google dit qu'il y a des milliers de résultats mais sur la dernière page, il y en a moins d'une centaine?


11

Pourquoi sur la première page, Google dit qu'il y a des milliers de résultats mais sur la dernière page, il y en a moins d'une centaine?

C'est une sorte de recherche Google récursive qui devrait s'expliquer d'elle-même. Il m'a fallu un certain temps pour peaufiner la phrase et essayer de trouver un nombre qui correspondrait précisément, la raison pour laquelle je l'ai changé en " centaines " à la place! : P

Si vous avez utilisé Google assez longtemps, vous êtes certainement tombé sur des situations similaires à plusieurs reprises. Chaque fois qu'il affiche moins de 10 pages, il est assez facile de le voir. Le fait est que le nombre de résultats sur n'importe quelle page, sauf la dernière, semble être une terrible estimation .

Ce qui est encore plus étrange, certains moments aléatoires, l'estimation devient soudainement bien meilleure et presque exactement la même sur toutes les pages que sur la dernière page - la seule page qui est toujours correcte.

Alors, quelqu'un sait pourquoi?


1
En ce moment sur la première page de cette recherche, il indique 3200 résultats, mais sur la dernière page, il indique 75 (pour les personnes intéressées par une mise à jour)
dkuntz2

@DKuntz c'est 2990 et 65 pour moi (pendant que je suis connecté) alors que si je me déconnecte (c'est ainsi que je l'ai fait la première fois), cela se transforme en 3120 et 77. Peut-être que plus tard je changerai légèrement la question et construirai une requête récursive plus cohérente - mais tout le monde est également invité à le faire! : P
cregox

Google est bizarre.
dkuntz2

Le mien dit toujours 208 résultats sur la dernière page, que ce soit 4 pages de résultats ou 22, il dit toujours 208.
mchid

Réponses:


6

Je ne connais pas la réponse exacte - peut-être que personne en dehors de Google ne le sait. Mais j'ai deux points de données qui peuvent être utiles.

Le premier est le point de vue de XKCD sur la question:

Il semble donc vraiment qu'il existe un certain seuil de volume de résultats au-delà duquel Google dit apparemment de «visser» et jette un nombre gigantesque. J'imagine que cela est probablement dû à l'incompétence plutôt qu'à la tromperie intentionnelle; Je suis sûr qu'il est difficile de générer rapidement des pages à partir de nombreuses sources, et peut-être que pour les recherches avec beaucoup de résultats, elles n'ont pas le temps de tout synchroniser. Ils truquent donc les chiffres. Le fait que cela donne l'impression d'avoir beaucoup plus de résultats qu'eux n'est probablement qu'un bonus involontaire.

Le deuxième point de données provient d'un professeur d'informatique que j'avais, qui était assez curieux à propos de ce problème et qui a dérangé certains amis de Google à ce sujet. Ils lui ont dit que parfois, il devient très coûteux de déterminer le nombre de résultats réellement renvoyés par une recherche, alors ils font simplement une meilleure supposition et retournent la première page de résultats, ce qui intéresse la plupart des gens. Ce n'est que lorsque vous commencez à explorer les pages que Google prend la peine de calculer entièrement les pages restantes.

Donc, ni l'un ni l'autre n'est une réponse définitive, mais j'espère qu'ils seront utiles pour expliquer les types de problèmes qui peuvent être à l'origine des inexactitudes de Google.

ÉDITER:

La réponse de Sathya sur cette page a une réponse du Webmaster KB de Google .

Lorsque vous effectuez une recherche, les résultats sont souvent affichés avec les informations: Résultats 1 - 10 d'environ XXXX.

Le calcul par Google du nombre total de résultats de recherche est une estimation. Nous comprenons qu'un chiffre approximatif est précieux, et en fournissant une estimation plutôt qu'un compte exact, nous pouvons retourner des résultats de recherche de qualité plus rapidement.

De plus, lorsque vous cliquez sur la page suivante des résultats de recherche, le nombre total de résultats de recherche peut changer. Dans ce cas, nous nous rendons compte que certains des résultats de la requête sont des doublons et réduisons ces doublons afin que vous puissiez trouver plus facilement le résultat spécifique que vous recherchez. Réduire les doublons diminue le nombre estimé de résultats, ainsi que le nombre total de pages de résultats.


Bien que j'adore XKCD et mes chers anciens professeurs, ce que vous me dites, c'est que je devrais probablement demander ceci sur stackoverflow.com: P
cregox

Je ne pense pas que quiconque chez stackoverflow aura une réponse définitive - si vous avez vraiment besoin de savoir, vous devriez demander à Google. Je ne peux que relayer la réponse de quelqu'un qui a demandé à Google il y a quelques mois.
dsolimano

ne cherche pas une réponse définitive, juste une avec une explication plus approfondie raisonnable, de préférence de bonne source. Ne vous méprenez pas, le vôtre est raisonnable, mais dire «parce que c'est difficile», même s'il fait autorité et a du sens, est trop peu pour moi. Hmm ... peut-être sceptiques.se: o
cregox

Joli montage, c'est du bon sourcing! Bien qu'il soit toujours dit "parce que c'est dur", ce qui signifie que j'espère toujours plus de détails. : P
cregox

7

Non - le nombre n'est qu'une approximation .

Lorsque vous effectuez une recherche, les résultats sont souvent affichés avec les informations: Résultats 1 - 10 d'environ XXXX.

Le calcul par Google du nombre total de résultats de recherche est une estimation. Nous comprenons qu'un chiffre approximatif est précieux, et en fournissant une estimation plutôt qu'un compte exact, nous pouvons retourner des résultats de recherche de qualité plus rapidement.

De plus, lorsque vous cliquez sur la page suivante des résultats de recherche, le nombre total de résultats de recherche peut changer. Dans ce cas, nous nous rendons compte que certains des résultats de la requête sont des doublons et réduisons ces doublons afin que vous puissiez trouver plus facilement le résultat spécifique que vous recherchez. Réduire les doublons diminue le nombre estimé de résultats, ainsi que le nombre total de pages de résultats.


Je pense que ce n'est pas un bon comportement s'ils limitent toujours le nombre de résultats à plus ou moins 1000 seulement. Au cas où l'utilisateur en voudrait plus, il devrait en montrer plus. À mon avis, certains mots clés courants devraient renvoyer une très grande quantité de résultats de recherche (comme fleur, livre ...) et je pense que des tonnes d'images différentes existent sur Internet!

@ user11656 vous supposez que Google Image Search fonctionne de la même manière qu'une recherche dans une application standard que vous pourriez utiliser. Les choses fonctionnent généralement très différemment à cette échelle. Il n'y a probablement pas de réponse unique pour «toutes les images qui correspondent à fleur» car un serveur en Australie pourrait avoir une image récemment téléchargée qui ne s'est pas encore propagée au serveur aux États-Unis. Ensuite, vous devez gérer des choses comme la façon de présenter des doublons et de faire tout cela sur des millions d'images pour des millions d'utilisateurs instantanément. C'est dur et vous devez faire des compromis architecturaux.
George Mauer

3

Le nombre de résultats Google est une mesure vide de sens . Outre l'effondrement des doublons, vous avez également une origine, la façon dont les comptes sont calculés en premier lieu en multipliant les fréquences, et le fait que Google impose un plafond qui définit le nombre maximal de résultats qui seront jamais retournés.


2

Aucune des réponses ci-dessus n'est correcte.

L'estimation de Google doit être plus proche du nombre réel de résultats que ce qui est donné.

Cela peut être montré par un exemple simple. Choisissez un mot assez fréquent comme "Russie" ou "michael". En vérité, il doit y avoir des milliers, sinon des centaines de milliers de sites Web sur Internet qui contiennent ces mots quelque part sur leur site. Mais les résultats de Google pourraient vous donner, disons, 700.

La vérité n'est pas que Google donne de vastes surestimations, mais que Google limite désormais considérablement le nombre de résultats qu'il vous donnera. Il réduit considérablement les résultats, à notre détriment majeur en tant qu'individus. C'est dommage car je veux lire les milliers de sites avec mes termes dans certains cas.

Je le sais car j'utilise Google depuis longtemps, peut-être 10 à 15 ans et j'ai remarqué qu'en règle générale, les résultats des termes sont devenus plus courts, plus longs, même si le nombre de sites avec les mêmes termes doit généralement ont augmenté depuis que j'utilise Google.

Alors que dans le passé, il y a des années, je pouvais obtenir peut-être 1000 résultats pour certains termes, maintenant j'obtiens 500 résultats pour les mêmes termes que j'aurais obtenus 1000 résultats.


2
Veuillez noter que "ci-dessus" n'a pas de contexte dans les réponses, car elles peuvent être triées de plusieurs manières différentes. Même si vous supposez le tri par défaut par "votes", leurs positions changeront au fur et à mesure que les votes haut et bas seront ajoutés.
ale

Très intéressant! La Russie ne me donne pour l'instant que 322 résultats et cela ne se voit que sur la toute dernière 34e page . Jusque-là, cela donnerait 799 000 000 résultats! Bien que ce soit un bon aperçu, cela ne semble toujours pas correct. Je ne pense pas non plus que les premières estimations soient correctes et l'intention n'apporte que des résultats qui sont affichés, pas "combien il pense qu'il existe sur le Web", d'où la dernière page qui le corrige.
cregox

1

Le problème avec le moteur de recherche Google (Image) est qu'il vise la pertinence en supprimant la variance. Tout d'abord, il est important de comprendre comment cela fonctionne. Une image téléchargée sur Internet doit être indexée de deux manières:

  • basé sur l'originalité (l'image peut être analysée par un "robot intelligent" basé sur la couleur, la taille, les motifs, la reconnaissance de forme, le type, etc.)
  • basé sur la similitude (l'image doit être analysée par un "smart bot2" et recoupée avec des images déjà existantes dans une base de données et étiquetée avec une ou deux étiquettes de catégorie: "l'image correspond" et "l'image est similaire à ... ")

Une fois l'indexation terminée, l'image héritera des "mots clés" à la suite de la reconnaissance pour éviter d'afficher les résultats hors sujet à l'utilisateur final. Le fait est que chaque mot clé est une phrase autonome avec une valeur attribuée en% en fonction de la force de la pertinence (c'est pourquoi le regroupement de plus de mots dans la zone de recherche entraîne moins de résultats et également lorsque vous recherchez une image en la téléchargeant ou en entrant une URL, Google attribuera une "supposition" avec uniquement les meilleurs mots clés, ce qui signifie que la recherche ne vous montrera jamais toutes les images simplement parce que la recherche n'est pas conçue pour le faire)

Donc, à la fin d'une journée, lorsque vous effectuez une recherche d'image et juste sous le champ de recherche, vous verrez un nombre énorme disant «25 270 000 000 résultats (0,55 seconde)», c'est presque toujours une sorte de faux numéro, car vous n'obtiendrez plus de 200 (max 500 mais seulement après que l'utilisateur le demande) résultats qui sont également filtrés pour exclure:

  • doublons externes (si la même image est 2+ fois sur la même page de site)
  • doublons de pertinence (affiche uniquement les "meilleurs résultats" - voir l'image ci-dessous)
  • images qui ont des problèmes avec la loi (voir l'image ci-dessous)
  • images qui violent le DMCA (voir l'image ci-dessous)
  • images provenant de sources SPAM, MALWARE, PHISHING
  • images cachées (si un utilisateur n'a pas désactivé la recherche sécurisée)
  • images sur liste noire de Google ( article )
  • images avec AR différent (essentiellement toutes les images qui ont un rapport d'aspect différent de la référence de recherche d'image. Par exemple. vous pouvez manquer tous les résultats souhaités si vous recherchez par votre image choisie - disons avec un rapport étrange 9: 7 - tandis que toutes les images indexées dans Google est avec un rapport 3: 4 - ce qui est peut-être le plus gros inconvénient de ce moteur de recherche car il obéit toujours au rapport d'aspect comme premier critère)
  • et plein d'autres

Pour résumer: les résultats de recherche d'une image ne sont jamais pleinement pertinents. Parfois, vous obtiendrez le résultat final souhaité avec une expression de recherche "affiche de porte", sinon ce pourrait être "couverture de porte", "porte bluray", "porte dvd", "porte 2015" ou même "自衛隊 彼 の 地 に て 斯 く 戦え り "- vous ne pouvez tout simplement pas obtenir des résultats d'image" TOUS ", car il n'y a rien qui soit" TOUS ", c'est pourquoi il est nécessaire de jouer avec pour y arriver. Il est également pertinent de mentionner qu'il existe d'autres moteurs de recherche d'images qui peuvent faire le travail de manière plus différente, car ils fonctionnent sur des normes et des critères différents. Ce n'est pas et n'a jamais été "Google" seulement ... >> https://www.yandex.com/images/

extensions notables:


Encore une fois, les marquer comme doublons serait beaucoup plus utile que de poster la réponse à chaque question.
jonsca

0

En haut, il indique la page 70 des 7000 résultats (exemple). Il donnera le numéro de page et le nombre de résultats. Il n'y a pas 70 résultats, mais 70 pages. J'espère que cela t'aides.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.