Imaginez que je voulais une simple copie de page à télécharger sur mon disque dur pour une conservation permanente. Je ne recherche pas un get récursif profond, juste une seule page, mais aussi des ressources chargées par cette page à télécharger également.
Exemple: https://www.tumblr.com/
Attendre:
- L'index.html
- Toutes les images chargées
- Tous les fichiers JS chargés
- Tous les fichiers CSS chargés
- Toutes les images chargées dans le fichier CSS
- liens pour les ressources de la page localisées pour fonctionner avec les copies téléchargées (pas de dépendance Web)
Je suis intéressé de savoir si vous pouvez m'aider à trouver la meilleure syntaxe wget ou un autre outil qui le fera. Les outils que j'ai essayés ne parviennent généralement pas à charger les images par CSS, de sorte que la page ne semble jamais correcte lorsqu'elle est chargée localement. Je vous remercie!
Solution tangente
J'ai trouvé un moyen de le faire en utilisant FireFox. La sauvegarde par défaut est interrompue et il existe un module complémentaire appelé "Save Complete" qui peut apparemment faire un bon travail avec cela. Cependant, vous ne pouvez pas le télécharger car il indique qu'il n'est pas pris en charge dans la version actuelle de FireFox. La raison en est qu'il a été intégré à cet addon: "Mozilla Archive Format". Installez-le, puis lorsque vous utilisez Fichier> "Enregistrer la page sous ..", il y a une nouvelle option appelée "Page Web, complète" qui est essentiellement l'ancien addon, qui corrige l'implémentation de stock utilisée par FireFox (ce qui est terrible). Ce n'est pas une solution WGET mais elle fournit une solution viable.
EDIT: Un autre problème ridicule pour quiconque pourrait suivre cette question à l'avenir, en essayant de le faire. Assurez-vous que l'addon fonctionne correctement, vous devez Outils> Format d'archive Mozilla et modifiez le paramètre par défaut (terrible) de "prendre un instantané fidèle de la page" pour "préserver les scripts et la source à l'aide de Save Complete", sinon l'addon videra tout vos fichiers de script et remplacez-les par le texte "/ * Script supprimé par snapshot save * /".