Malheureusement, notre fournisseur d'hébergement a subi une perte de données de 100%. J'ai donc perdu tout le contenu de deux sites Web de blogs hébergés:
(Oui, oui, je absolument aurais dû faire des sauvegardes hors site complet Malheureusement, toutes mes sauvegardes étaient sur le serveur lui - même donc enregistrer la conférence,.. Vous êtes 100% tout à fait raison, mais cela ne me permet pas au moment de Let. restez concentré sur la question ici!)
Je commence le lent et pénible processus de récupération du site Web à partir de caches de robots Web.
Il existe quelques outils automatisés permettant de récupérer un site Web à partir de caches, telles que Warrick (Yahoo, Bing, Google, etc.) , mais j'ai obtenu de mauvais résultats en utilisant ceci:
- Mon adresse IP a été rapidement bannie de Google pour son utilisation
- Je reçois beaucoup d'erreurs 500 et 503 et "attente 5 minutes…"
- En fin de compte, je peux récupérer le contenu du texte plus rapidement à la main
J'ai eu beaucoup plus de chance en utilisant une liste de tous les articles de blog, en accédant au cache Google et en enregistrant chaque fichier au format HTML. Bien qu'il ya beaucoup de messages de blog, il n'y a pas que beaucoup, et je me dis que je mérite une certaine auto-flagellation pour ne pas avoir une meilleure stratégie de sauvegarde. Quoi qu’il en soit, l’important est que j’ai eu de la chance d’obtenir le texte d’un article de blog de cette façon et que je puisse définitivement extraire le texte des pages Web des caches Internet. Sur la base de ce que j’ai fait jusqu’à présent, je suis confiant de pouvoir récupérer tout le texte et tous les commentaires de blogs perdus .
Cependant, les images qui accompagnent chaque article de blog se révèlent… plus difficiles.
Des conseils généraux pour récupérer des pages de sites Web à partir de caches Internet, et en particulier des endroits pour récupérer des images archivées à partir de pages de sites Web ?
(Et encore une fois, s'il vous plaît, pas de cours magistraux supplémentaires. Vous avez tout à fait raison! Mais avoir raison ne résout pas mon problème immédiat… à moins que vous n'ayez une machine à remonter le temps…)