Webmasters robots.txt

5

Puis-je invoquer Google pour vérifier mon robots.txt?

J'ai lu les réponses à cette question, mais elles laissent toujours ma question ouverte: Google cache-t - il le fichier robots.txt? Je n'ai pas trouvé de moyen dans les outils Google pour les webmasters pour invoquer un nouveau téléchargement de mon robots.txt . Par une erreur, mon robots.txt a été …

11 google google-search-console robots.txt

3

Google Preview obéit-il à Robots.txt?

Parce que ça ressemble à ça. Pour mes sites, nous interdisons le répertoire d'images et les aperçus sont toutes des images manquantes, ce qui donne au site un aspect bancal. Est-ce le cas et existe-t-il un moyen d'autoriser uniquement le bot de prévisualisation à accéder aux images à l'aide de …

11 google robots.txt

3

Un index de plan de site peut-il contenir d'autres index de plan de site?

J'ai un site Web bilingue avec un index de plan de site pour chaque langue qui renvoie à plusieurs plans de site différents (un pour les vidéos, un pour le contenu statique et un pour les articles). Je voudrais introduire un autre plan de site qui relie les index de …

11 google sitemap robots.txt

1

Comment fonctionne «Noindex:» dans robots.txt?

J'ai parcouru cet article dans mes actualités SEO aujourd'hui. Cela semble impliquer que vous pouvez utiliser des Noindex:directives en plus des Disallow:directives standard dans robots.txt . Disallow: /page-one.html Noindex: /page-two.html Il semble que cela empêcherait les moteurs de recherche d'explorer la page un et les empêcherait d'indexer la page deux. …

10 web-crawlers robots.txt googlebot noindex

2

Autoriser uniquement les robots Google et Bing à explorer un site

J'utilise le fichier robots.txt suivant pour un site: l'objectif est de permettre à googlebot et bingbot d'accéder au site à l'exception de la page /bedven/bedrijf/*et d'empêcher tous les autres bots d'explorer le site. User-agent: googlebot Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: google Disallow: /bedven/bedrijf/* Crawl-delay: 10 User-agent: bingbot Disallow: /bedven/bedrijf/* Crawl-delay: …

10 web-crawlers robots.txt

1

Combinez les agents utilisateurs dans le fichier robots.txt

Les agents utilisateurs peuvent-ils être répertoriés ensemble, suivis de leurs règles communes comme dans un fichier robots.txt ? User-agent: Googlebot User-agent: ia_archiver #Alexa User-agent: BingPreview #Microsoft User-agent: bingbot #Microsoft User-agent: MSNBot #Microsoft User-agent: Slurp #Yahoo User-agent: Ask Jeeves/Teoma #Ask Disallow: /adm30_buds/

10 web-crawlers robots.txt user-agent

3

Comment puis-je utiliser robots.txt pour interdire uniquement le sous-domaine?

Ma base de code est partagé entre plusieurs environnements ( en direct, la mise en scène, dev) et sous-domaines ( staging.example, dev.example, etc.) et seulement deux devraient être autorisés à être rampé (ie. www.exampleEt example). Normalement, je modifierais /robots.txtet ajouterais Disallow: /, mais en raison de la base de code …

10 domains subdomain robots.txt multi-subdomains

6

Comment (correctement) autoriser le bot archive.org? Les choses ont-elles changé, si oui, quand?

J'ai un site Web que je ne veux surtout pas être indexé par les moteurs de recherche, mais je veux le conserver pour l'éternité sur archive.org. Donc, je robots.txtcommence par ceci: User-agent: * Disallow: / Aujourd'hui, selon archive.org, je dois ajouter ce qui suit dans mon robots.txtpour autoriser leurs bots: …

10 web-crawlers robots.txt internet-archive

10

Besoin d'empêcher les robots de tuer mon serveur Web

J'ai des problèmes de bot EXTREME sur certains de mes sites Web dans mon compte d'hébergement. Les bots utilisent plus de 98% de mes ressources CPU et 99% de ma bande passante pour l'ensemble de mon compte d'hébergement. Ces bots génèrent plus de 1 Go de trafic par heure pour …

9 php htaccess robots.txt

1

Dois-je bloquer les pages d'archives Wordpress des moteurs de recherche?

J'utilise WordPress et des /sample-post/URL pour mes publications et /yyyy/mm/pour les archives. Google a entièrement indexé le site. Étant donné que les archives affichent actuellement des articles complets, j'ai pensé que je ne devrais pas laisser Google indexer les pages d'archives car elles contiennent les articles complets et ce sera …

9 seo wordpress robots.txt duplicate-content google-index

4

Les robots refusés par domaine sont toujours répertoriés dans les résultats de recherche

Ainsi, sur tous nos sites qui ne sont pas confrontés à la recherche, nous avons appliqué un fichier robots.txt (par Comment exclure un site Web des résultats de recherche Google en temps réel?, Ou toute autre question similaire). Cependant, si les termes de recherche sont suffisamment spécifiques, le domaine lui-même …

9 seo robots.txt

3

Lorsque vous déplacez un site via une redirection 301, devez-vous configurer un robots.txt interdisant aux robots d'explorer l'ancienne adresse?

Un site sur lequel je travaille a déplacé un sous-domaine vers un autre sous-domaine via une redirection 301. Cependant, lors de la vérification du fichier robots.txt de l'ancien sous-domaine, il possède un fichier robots.txt qui interdit aux robots d'exploration des moteurs de recherche de l'explorer. Est-ce la bonne décision? Je …

8 seo redirects robots.txt

5

Faut-il modifier notre Joomla robots.txt après l'annonce de Google sur l'exploration de CSS et JavaScript?

J'ai rencontré une annonce de Google: http://googlewebmastercentral.blogspot.in/2014/10/updating-our-technical-webmaster.html Il est dit: Pour un rendu et une indexation optimaux, notre nouvelle directive spécifie que vous devez autoriser Googlebot à accéder aux fichiers JavaScript, CSS et image que vos pages utilisent. Cela vous offre un rendu et une indexation optimaux pour votre site. …

8 seo google-search-console robots.txt joomla

4

Robots.txt vs Sitemap - Qui gagne dans un conflit

Si je bloque le répertoire / foo dans robots.txt, mais que mon plan de site xml contient des URL avec / foo, les URL du plan de site seront-elles récupérées par Google et d'autres moteurs de recherche? En d'autres termes, le plan du site l'emporte-t-il sur robots.txt? Je pense que …

8 robots.txt xml-sitemap

2

Quelle est la bonne façon de gérer Autoriser et Interdire dans robots.txt?

J'exécute un robot d'indexation à grande échelle. Nous nous efforçons de faire fonctionner le robot dans les normes de la communauté acceptées, et cela inclut le respect de robots.txt. Nous recevons très peu de plaintes concernant le robot, mais lorsque nous le faisons, la majorité concerne notre gestion de robots.txt. …

8 robots.txt

Questions marquées «robots.txt»