J'ai un sous-répertoire que je voudrais cacher aux robots d'indexation des moteurs de recherche.
Une façon de le faire est d'utiliser un robots.txtdans le répertoire racine du serveur (la manière standard). Cependant, toute personne connaissant l'URL du site Web et possédant des connaissances de base sur le Web peut accéder au contenu du fichier robots.txt et repérer les répertoires interdits.
J'ai pensé à un moyen d'éviter cela, mais je ne sais pas si cela fonctionnera.
Soit Xle nom du sous-répertoire que je souhaite exclure. Une façon d'empêcher Web Crawlers d'indexer le Xrépertoire et en même temps de rendre plus difficile pour quelqu'un d'identifier le Xrépertoire à partir de la racine robots.txt, consiste à ajouter le robots.txtdans le Xrépertoire au lieu du répertoire racine.
Si je suis cette solution, j'ai les questions suivantes:
- Les explorateurs Web trouveront-ils le
robots.txtdans le sous-répertoire? (étant donné que, ilrobots.txtexiste déjà et dans le répertoire racine aussi) Si se
robots.txttrouve dans leXsous-répertoire, dois-je utiliser des chemins relatifs ou absolus?:User-agent: * Disallow: /X/ou
User-agent: * Disallow: /