WordPress avec SOFT 404 dans Google Search Console (WMT) Quelles sont les causes de Q82019309.com?


8

Le site de mes frères que j'ai conçu pour lui depuis un certain temps contient des centaines de SOFT 404 dans la Search Console de Google, anciennement Webmaster Tools. En général, je trouve la fixation 404 souple facile, mais cela me rend un peu perplexe. Toutes les erreurs logicielles renvoient une chaîne impaire qui contient Q82019309.comle sous-dossier occasionnel de Aristocratla chaîne /?=.

Les 404 ressemblent généralement à quelque chose comme:

  • Encodé: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Décodé: /search/大奖总代Q82019309.com

L'information liée à partir fournit:

  • Encodé: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Décodé: /?s=大奖总代Q82019309.com

Au début, je pensais que c'était un problème isolé, mais après enquête, j'ai découvert que ce problème affecte en fait des milliers de sites Web et que quelqu'un doit en connaître la cause. Lorsque je Google Q82019309.com WordPress ou Aristocrat Q82019309.com, je suis submergé par la quantité de résultats, y compris certains des sites très réputés tels que:

Des questions):

Alors, quelle est la cause de ces erreurs 404 logicielles Q82019309.comavec ou sans chaîne Aristocrat.


Votre site a été piraté. Q82019309.com est compromis.
closetnoc

Aller sur le site Q82019309.com dit que c'est un site d'attaque et je reconnais que c'est douteux mais j'ai du mal à croire que tous ces sites ont été piratés avec quelque chose qui utilise une chaîne de requête dans la recherche. Il existe des centaines de milliers de sites Web littéraires qui signalent Q82019309.com ... des sites très réputés ... ils ne sont certainement pas tous piratés?
Simon Hayter

Les liens semblent être tous du spam. Un profil très typique. De plus, cela semble être spécifique aux sites WP. Cela semble être assez récent, en quelques jours (environ 4). Vérifiez l'installation de WP pour vous assurer que tout est à jour. Voir: web.nvd.nist.gov/view/vuln/…
closetnoc

A été découvert il y a plus d'une semaine le 13.
Simon Hayter

Je pense que je vais devoir parcourir les erreurs.log et access.logs pour identifier si quelqu'un a tenté ou est entré via un nouveau hack.
Simon Hayter

Réponses:


2

Nous avions le même problème sur sagespops.com depuis le 3 janvier 2017.

Google se plaint de Soft 404 même si l'indexation est désactivée sur ces pages. La page de recherche Wordpress a par défaut cette méta:

<meta name="robots" content="noindex,follow">

J'ai décidé que les pages de recherche sans résultats renvoient un code HTTP 404. Étant donné que la requête de recherche se trouve dans l'URL, il est correct de la traiter de cette façon.

Pour Wordpress, j'ai ajouté à la fin des fonctions de mon thème.php:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');

@ sagespops.com: J'ai le même problème avec cette stupide attaque de recherche par spam. Merci pour le code! Cela a très bien fonctionné pour moi! Maintenant, la recherche vide renvoie un 404 propre et c'est cool. Cordialement, Mitschu
Mitschu

Est-ce que cela enverrait un utilisateur réel qui effectue une recherche et n'obtient aucun résultat sur une page 404?
brandozz

1

Il me semble que votre quelque chose est lié à la fonctionnalité de recherche de votre site avec de mauvaises requêtes. Ces requêtes de recherche obtiennent "aucun résultat trouvé". Googlebot recherche ces liens et vous autorisez Googlebot à explorer votre recherche de site. En raison de "l'absence de résultats", Google les détecte comme "soft 404".

Laisser Google explorer les résultats de recherche de votre site est un grand non. Il peut pénaliser l'intégralité de votre site par Google. Voir Matt Cutts: Résultats de recherche dans les résultats de recherche . Vous devez interdire toute exploration des résultats de recherche à l'aide de robots.txt :

Disallow: /search
Disallow: /?s=

Ensuite, Googlebot n'explorera pas ces URL et n'y signalera pas non plus d'erreurs.


Stephen, est-ce que cela a fait resurgir les 404 souples? J'ai en fait ajouté cela à mon robots.txt et marqué tous mes 404 doux sur la page de recherche comme fixes. Une fois que je vérifierai, je marquerai ceci comme correct. Mais cela semble être la meilleure solution.
brandozz

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.