Ils proviennent de grattoirs Web utilisant incorrectement Yahoo! Résultat de la recherche . Cette découverte a été faite par @tenants sur le forum XenForo . Ils expliquent davantage les implications de la réception de ces demandes et comment ils les traitent.
1. Pensez-vous que nous devrions nous préoccuper de ces demandes?
Vous n'avez pas à vous soucier de ces demandes. Ce ne sont que des caractéristiques des bots stupides et des bots stupides se promènent partout sur Internet. Ces demandes ne doivent pas être identifiées comme malveillantes uniquement en fonction de l'URL, elles sont probablement innocentes.
2. Quelles sont ces demandes essayant d'archiver?
Ils essaient d'obtenir le contenu de la page qu'ils demandent. Ils n'ont aucun effet spécial, ce sont des produits (non souhaités) d'un Yahoo! Recherche de grattage.
3. Que pouvons-nous faire pour les arrêter?
Pas vraiment, tout le monde est libre de poster toutes les demandes qu'il aime sur le net . (Au moins techniquement. Aspects sociaux et juridiques mis de côté.)
Vous pouvez les jeter lors de la génération de rapports à partir de vos journaux. C'est l'option que j'ai choisie.
Ou vous pouvez essayer de corriger les demandes pour réussir et ne pas générer d'entrées de journal . C'est probablement ce que la plupart font de ce que j'ai vu sur le web. Je vois une faille dans cette approche. Tout en améliorant l'expérience de leurs visiteurs, ils oublient qui sont ces visiteurs. Bots stupides. Je ne veux pas de bots stupides sur mes sites, donc je ne vais pas prendre la peine d'améliorer leur expérience.
Si vous souhaitez corriger les demandes, vous pouvez le faire en utilisant mod-réécriture, peut-être appelé depuis .htaccess, par exemple en utilisant le code du post du forum XenForo que j'ai mentionné ci-dessus:
RewriteEngine On
# strange behaving bots, these are urls scraped from yahoo (botters scrapping for links, yahoo search link contain RK RS) tenants modification:
RewriteRule ^(.*)RK=0/RS= /$1 [L,NC,R=301]
RewriteRule ^(.*)RS=^ /$1 [L,NC,R=301]
Vous devrez peut-être un peu manipuler les expressions rationnelles, par exemple ajouter une barre oblique supplémentaire après le (.*)
si vos URL ne se terminent pas par une.
en relation
Félicitations à la réponse de @ dman sur Stack Overflow et au commentaire de @webaware sous cette question pour avoir trouvé le message du forum XenForo.