Réponses:
Aucun bot qui recueille des e-mails ou teste votre site pour des vulnérabilités ne respectera votre robots.txt. En fait, ces robots malveillants consultent le fichier robots.txt pour mieux cartographier votre site. Si vous avez un point, Disallow:
cela sera utilisé pour mieux attaquer votre site. Un pirate qui examine manuellement votre site devrait passer plus de temps à examiner tous les fichiers / répertoires que vous essayez de refuser.
robots.txt n'augmentera pas la sécurité de votre site Web et n'empêchera pas la collecte d'adresses e-mail. robots.txt est un guide permettant aux moteurs de recherche de sauter des sections de votre site Web. Ceux-ci ne seront pas indexés et devraient être utilisés pour toutes les sections que vous ne souhaitez pas afficher dans les moteurs de recherche publics.
Cependant, cela n'empêchera en aucun cas d'autres robots de télécharger l'intégralité de votre site pour augmenter la sécurité ou empêcher la collecte des e-mails. Pour augmenter la sécurité, vous devez ajouter l'authentification et autoriser uniquement les utilisateurs authentifiés au-delà des sections sécurisées. Pour empêcher la collecte d'adresses e-mail, ne placez pas les e-mails en texte brut (ou texte facilement déchiffrable) sur un site Web.
Le fichier robots.txt ne sert qu'à demander aux robots et aux araignées de laisser certains éléments de contenu seuls; cela ne peut pas réellement empêcher leur accès. Les "bons" bots le respecteront, mais les "mauvais" (probablement ceux que vous voulez bloquer) l'ignoreront et continueront quand même.
Au lieu de robots.txt, vous devrez peut-être utiliser des codes CAPTCHA.