Si je ne veux pas définir de comportement spécial, est-ce correct si je n'ai pas la peine d'avoir un fichier robots.txt?
Ou le manque d'un peut-il être nocif?
Si je ne veux pas définir de comportement spécial, est-ce correct si je n'ai pas la peine d'avoir un fichier robots.txt?
Ou le manque d'un peut-il être nocif?
Réponses:
L'absence d'un fichier robots.txt ne sera pas nuisible. Depuis le site Web de robotstxt.org :
Pour permettre à tous les robots un accès complet
User-agent: *
Interdire:(ou créez simplement un fichier "/robots.txt" vide, ou n'en utilisez pas du tout)
Cependant, même si vous ne spécifiez rien dans votre fichier robots.txt, c'est un bon moyen d' informer les moteurs de recherche de l'emplacement de votre sitemap XML . Vous pouvez le faire en ajoutant une ligne en haut de votre fichier robots.txt qui ressemble à quelque chose comme:
Plan du site: http://www.example.com/sitemap-host1.xml
Vous devez également savoir que ne pas l'avoir créera un grand nombre de 404 entrées dans vos journaux Web.
Si vous n'avez pas de "robots.txt", votre journal d'erreurs recevra beaucoup de 404 sur le fichier, ce qui pourrait être une sorte de contrariété, comme si vous n'avez pas de favicon.
robots.txt
fichier, qui en plus sera téléchargé moins souvent en raison des moteurs de recherche appliquant un contrôle de cache HTTP approprié .
Je pense qu'il faudrait avoir à être OK, sinon d' énormes étendues du web seraient un indexable par les araignées web.
Non robots.txt
équivaut à «autoriser l'indexation par tout le monde» robots.txt
presque par définition.
Eh bien, puisque robots.txt
contient l'adresse de votre sitemap , ne pas en avoir est potentiellement dangereux.