Téléchargeur de site Web (cache?) Pour afficher les sites hors ligne


9

Existe-t-il un moyen portable de télécharger ou de mettre en cache toutes les pages d'un site Web pour les consulter hors ligne? J'ai un vol de cross-country demain, et je voudrais pouvoir mettre en cache quelques pages Web (en particulier la page doc python ( http://docs.python.org/ ), et la référence pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Idéalement, j'aimerais un module complémentaire Firefox ou quelque chose comme ça, mais tout fonctionnera bien tant que je pourrai l'exécuter sous Linux.


Réponses:


15

J'utilise HTTrack .

Il vous permet de télécharger un site Web à partir d'Internet dans un répertoire local, de créer de manière récursive tous les répertoires, d'obtenir du HTML, des images et d'autres fichiers du serveur vers votre ordinateur.


J'ai utilisé celui-ci dans le passé, une belle solution gratuite.
MaQleod

1
HTTrack est le meilleur pour Linux et Windows et il y a une énorme liste d'options pour configurer le processus de téléchargement .. J'adore
eslambasha

Je l'ai aussi utilisé; ils proposent désormais également une version Android.
gparyani

-1 Il ne construit pas "tous les répertoires" il n'obtient pas toutes les "images et autres fichiers" .. Il obtient seulement ce à quoi il est lié.
barlop

6

J'utilise wget avec ces options pour mettre en miroir un site pour une utilisation hors ligne

wget -cmkE -np http://example.com/a/section/i/like

-m active les options de mise en miroir pour mettre en miroir un site localement

-c continue un téléchargement précédent au cas où j'aurais déjà téléchargé quelques pages

-k convertit le href absolu pour pointer vers le local pour un affichage hors ligne

-E garantit que les fichiers ont l'extension .html après le téléchargement.

-np télécharge uniquement les objets sous / a / section / i / et ne met pas en cache l'ensemble du site.

Par exemple, je voulais télécharger la documentation sud mais pas les billets sud, etc ...

wget -cmkE -np http://south.aeracode.org/docs/index.html

J'utilise Windows et exécute wget sur cygwin, mais il existe également un port wget natif pour Windows .

Bien que, dans votre cas, vous pouvez télécharger des documents hors ligne python à partir de la section des documents python


1

Essayez http://www.downthemall.net/ un plugin Firefox. Je l'ai utilisé pour télécharger 250 pages de PDF dans plus de 20 fichiers distincts. C'est extrêmement puissant. Il a une syntaxe générique / requête qui vous permet d'obtenir chirurgicalement uniquement les fichiers que vous voulez et aucun de ceux que vous ne voulez pas.


1

Quelques extensions Firefox que je connais:

  • ScrapBook

    vous aide à enregistrer des pages Web et à gérer facilement les collections. Les principales caractéristiques sont la légèreté, la vitesse, la précision et la prise en charge multilingue. Les principales fonctionnalités sont:

    • Enregistrer la page Web
    • Enregistrer l'extrait de page Web
    • Enregistrer le site Web
    • Organisez la collection de la même manière que les signets
    • Recherche plein texte et recherche rapide par filtrage de la collection
    • Modification de la page Web collectée
    • Fonction d'édition de texte / HTML ressemblant aux notes d'Opera
  • ScrapBook Plus

    Différence entre ScrapBook Plus et ScrapBook:

    • tri plus rapide
    • importation et exportation plus rapides
    • ouvrez la fenêtre pour gérer votre collection directement depuis la barre latérale
    • simplifié la gestion de "l'assistant de combinaison"
    • nouvelles fonctionnalités pour "Capturer plusieurs URL" (filtre pour exclure les liens, utiliser le titre du site Web ou le titre du lien comme nouveau titre pour l'entrée dans la barre latérale, spécifier le temps d'attente entre le téléchargement de 0 à 3 secondes, utiliser UTF-8 ou ISO-8859-1 comme jeu de caractères)
    • nouvelle fenêtre "Capture" (le téléchargement doit être démarré manuellement, le défilement automatique est désactivé)
    • 6 surligneurs dans l'éditeur
  • UnMHT

    vous permet d'afficher des fichiers au format d'archive Web MHT (MHTML) et d'enregistrer des pages Web complètes, y compris du texte et des graphiques, dans un seul fichier MHT

  • Pocket (pas une extension; une fonction Firefox intégrée)

    vous permet d'enregistrer des pages Web et des vidéos dans Pocket en un seul clic. Pocket supprime l'encombrement et enregistre la page dans une vue propre et sans distraction et vous permet d'y accéder en déplacement via l'application Pocket.

    Notez que:

    L'enregistrement et l'accès à votre liste de poche sur Firefox nécessite une connexion Internet. La visualisation hors ligne est possible sur d'autres appareils avec l'application Pocket.


0

Vous pouvez télécharger un site Web entier ou une partie d'un site Web avec wget.

wget -r http://docs.python.org/

Consultez le manuel de wget pour d'autres options que vous voudrez peut-être passer, par exemple pour limiter votre utilisation de bande passante, pour contrôler la profondeur de récursivité, pour configurer des listes d'exclusion, etc.

Une autre approche de la navigation hors ligne consiste à utiliser un proxy de mise en cache. Wwwoffle est celui qui possède de nombreuses fonctionnalités pour faciliter la rétention pour la navigation hors ligne, telles que des remplacements aux dates d'expiration spécifiées par le serveur et une capacité de prélecture récursive. (J'utilise wwwoffle depuis mes jours de connexion.)

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.