J'ai remarqué que Google Webmaster Tools signale un grand nombre de ressources bloquées sur mon site Web. À l'heure actuelle, toutes les «ressources bloquées» sont les .css, .js et les images (.jpg, .png) que je sers depuis Cloudfront CDN.
J'ai passé beaucoup de temps à tester et à essayer de comprendre pourquoi Google n'explore pas ces fichiers et signale un état de "bloc de ressources".
Actuellement, je sers ces fichiers à partir de plusieurs noms d'hôtes comme: cdn1.example.com, cdn2.example.com,…
cdn1, cdn2 et les autres sont des CNAME au nom de distribution cloudfront.
Test: j'ai essayé d'utiliser directement la distribution cloudfront (pas de CNAME) mais le problème persiste.
Actuellement, mon robots.txt ressemble à ceci:
# Google AdSense
User-agent: Mediapartners-Google
Disallow:
#Google images
User-agent: Googlebot-Image
Disallow: /
User-agent: *
Disallow: /homepage
Disallow: /index.php*
Disallow: /uncategorized*
Disallow: /tag/*
Disallow: *feed
Disallow: */page/*
Disallow: *author*
Disallow: *archive*
Disallow: */category*
Disallow: *tag=*
Disallow: /test*
Allow: /
Et des exemples de fichiers bloqués dans une page d'exemple:
cdn1.example.com/wp-content/plugins/wp-forecast/wp-forecast-default.css
cdn9.example.com/wp-content/plugins/bwp-minify/min/?f=wp-content/themes/magazine/css/font-awesome.min.css,wp-content/themes/magazine/css/responsive .css
cdn5.example.com/wp-content/themes/magazine/images/nobg.png
cdn6.example.com/wp-content/plugins/floating-social-bar/images/fsb-sprite.png
cdn5.example.com/wp-content/uploads/2013/11/Design-Hotel-3-80x80.jpg
cdn5.example.com/wp-content/uploads/2013/11/Marta-Hotel-7-270x225.jpg
J'ai même essayé de tout autoriser dans le fichier robots.txt mais j'ai toujours le même résultat.
J'ai également examiné attentivement les paramètres CloudFront d'Amazon et je ne vois rien qui puisse être lié (je n'utilise pas et n'ai jamais utilisé l'option: "Restreindre l'accès au visualiseur (utiliser des URL signées ou des cookies signés)").
En ce moment, j'ai passé beaucoup de temps à étudier cela et je n'ai plus d'idées.
Quelqu'un peut-il penser à une raison pour laquelle Googlebot ne serait pas autorisé à analyser des fichiers hébergés dans Amazon CloudFront?
*
à la fin de l'URL "préfixe". /test*
est le même que /test
.