Les moteurs de recherche sont de plus en plus utilisés comme gardiens de l'information, mais les critères utilisés par les moteurs de recherche pour classer les résultats sont opaques pour les utilisateurs. Comment les utilisateurs peuvent-ils être sûrs que leurs résultats ne sont pas biaisés ou falsifiés d'une manière ou d'une autre afin de susciter un certain intérêt au détriment de la qualité des résultats de recherche?
Les gouvernements exigent régulièrement que les moteurs de recherche suppriment ou réduisent le classement des sites Web jugés politiquement indésirables. Les entreprises peuvent payer des fournisseurs pour augmenter certains résultats par rapport à d'autres afin d'augmenter leurs revenus. Les pare-feu peuvent se mêler des résultats avant qu'ils ne soient retransmis aux utilisateurs.
Même des changements apparemment anodins dans des algorithmes de classement qui pourraient ne pas apparaître à première vue semblent être biaisés, pourraient en fait être conçus de manière sournoise pour nuire aux sites Web qui partagent certains attributs communs (sans rapport avec la qualité réelle).
Est-il possible de détecter les biais des moteurs de recherche, par exemple en surveillant les résultats sur une période de temps et en évaluant si une "variable cachée" (peut-être une affiliation politique) est un facteur déterminant dans le changement de classement des sites Web?
Un fournisseur sournois peut progressivement réduire au fil du temps le classement des sites Web ciblés (et peut-être aussi des sites Web aléatoires pour distraire les utilisateurs). Quelles sont les limites du degré de biais qu'un fournisseur peut introduire sans détection? Ou est-il possible de toujours cacher une telle interférence en sélectionnant sournoisement des critères de classement pondérés qui produisent incidemment le résultat escompté (par le biais de "l'espionnage des données").
Est-ce que cela change si les critères de classement sont rendus publics? Avons-nous besoin d'ouvrir les critères de recherche des moteurs de recherche?
Cela me rappelle le résultat que détecter si un instrument financier complexe tel qu'un CDO a été falsifié par le vendeur équivaut à résoudre le problème du sous-graphique le plus dense:
http://www.cs.princeton.edu/~rongge/derivative.pdf
Merci!