Comment pourrais-je gratter le texte d'un site? [fermé]


1

Schemer est en train de fermer ses portes et j'essaie de préserver le texte car il y a beaucoup de bonnes idées sur le site. Je voudrais obtenir le texte de chacun des liens énumérés sur le plan du site .

Est-ce qu'il y a un moyen de faire ça? HTTrack ne fonctionne pas comme je le voudrais.

Réponses:


0

Wget est un outil classique en ligne de commande pour ce type de tâche. Il est fourni avec la plupart des systèmes Unix / Linux, et vous pouvez également l’obtenir pour Windows.

Vous feriez quelque chose comme:

wget -r --no-parent https://www.schemer.com/sitemap?lo=1

Pour plus de détails, voir le Manuel Wget et son exemples , ou jetez un oeil à ceux-ci:

http://linuxreviews.org/quicktips/wget/

http://www.linuxjournal.com/content/downloading-entire-web-site-wget

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.