J'ai un sous-répertoire que je voudrais cacher aux robots d'indexation des moteurs de recherche.
Une façon de le faire est d'utiliser un robots.txt
dans le répertoire racine du serveur (la manière standard). Cependant, toute personne connaissant l'URL du site Web et possédant des connaissances de base sur le Web peut accéder au contenu du fichier robots.txt et repérer les répertoires interdits.
J'ai pensé à un moyen d'éviter cela, mais je ne sais pas si cela fonctionnera.
Soit X
le nom du sous-répertoire que je souhaite exclure. Une façon d'empêcher Web Crawlers d'indexer le X
répertoire et en même temps de rendre plus difficile pour quelqu'un d'identifier le X
répertoire à partir de la racine robots.txt
, consiste à ajouter le robots.txt
dans le X
répertoire au lieu du répertoire racine.
Si je suis cette solution, j'ai les questions suivantes:
- Les explorateurs Web trouveront-ils le
robots.txt
dans le sous-répertoire? (étant donné que, ilrobots.txt
existe déjà et dans le répertoire racine aussi) Si se
robots.txt
trouve dans leX
sous-répertoire, dois-je utiliser des chemins relatifs ou absolus?:User-agent: * Disallow: /X/
ou
User-agent: * Disallow: /