Questions marquées «wget»

wget - utilitaire de ligne de commande pour télécharger le contenu de manière non interactive (peut être appelé à partir de scripts, de tâches cron, de terminaux sans le support de X-Windows, etc.)



2
Ignorer les «autres» domaines lors du téléchargement avec wget?
Je voudrais explorer les liens sous www.website.com/XYZ et télécharger uniquement les liens qui se trouvent sous www.website.com/ABC. J'utilise la commande wget suivante pour obtenir les fichiers que je veux: wget -I ABC -r -e robots=off --wait 0.25 http://www.website.com/XYZ Cela fonctionne parfaitement lorsque j'utilise wget 1.13.4. Mais le problème est que …



2
Alternatives à wget
J'ai un site sur un serveur qui est essentiellement un tas de pages HTML, d'images et de sons. J'ai perdu mon mot de passe sur ce serveur et je dois récupérer tout ce qui y est stocké. Je peux aller page par page et tout enregistrer mais le site compte …
13 wget 

1
Comment contourner les en-têtes «dernière modification» manquants?
Je cours wgetcomme ça: wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main Je reçois un tas de ces messages: Last-modified header missing -- time-stamps turned off. Je suppose que cela signifie que les pages sont de nouveau téléchargées, même si je les ai localement. REMARQUE : je le souhaite pour …
13 wget  web 

2
Voulez-vous retourner le binaire au lieu du HTML?
J'utilise wget pour télécharger une page html statique. Le validateur W3C m'indique que la page est encodée en UTF-8. Pourtant, lorsque je cat le fichier après le téléchargement, je reçois un tas de bêtises binaires. Je suis sur Ubuntu, et je pensais que l'encodage par défaut était UTF-8? C'est ce …

2
Wget: convertir des liens et éviter de retélécharger des fichiers déjà récupérés?
Je télécharge des données réparties sur plusieurs fichiers qui ne changent pas une fois publiées. Par conséquent, ce --timestampingn'est pas suffisant, car il vérifie constamment quelle que soit la ressource modifiée, ce qui est, dans mon cas, complètement inutile. --no-clobberconviendrait parfaitement. Malheureusement, cela ne fonctionne pas --convert-links pour une raison …
12 wget  download 


3
montage de dropbox (pour explorer les fichiers)
Je veux simplement pouvoir explorer un système de fichiers dropbox, sans beaucoup de charge supplémentaire sur le CPU, la mémoire, le stockage (c'est-à-dire sans enregistrer localement des copies des fichiers distants). Il semble que le client officiel consomme beaucoup de réassurances (et ferait des opérations inutiles comme la synchronisation) - …

5
Comment arrêter «wget» après avoir obtenu un 404?
Si vous utilisez l'extension d'accolade avec wget, vous pouvez facilement récupérer des images numérotées séquentiellement: $ wget 'http://www.iqandreas.com/sample-images/100-100-color/'{90..110}'.jpg' Il va chercher les 10 premiers fichiers numérotés 90.jpgà 99.jpgtrès bien, mais 100.jpget revenir en avant une 404: Fichier introuvable erreur (je seulement 100 images stockées sur le serveur). Ces fichiers inexistants …

2
Quel est l '«article de 2001» pour bloquer les «programmes de récupération automatisée» auxquels fait référence la page de manuel wget?
La wgetpage de manuel indique ceci, sous la section pour le --random-waitparamètre: Some web sites may perform log analysis to identify retrieval programs such as Wget by looking for statistically significant similarities in the time between requests. [...] A 2001 article in a publication devoted to development on a popular …

1
Wget, abandon de nouvelle tentative après un échec ou un timeout
J'appelle une URL avec wget: /usr/bin/wget --read-timeout=7200 https://site_url/s Wget effectue une requête GET toutes les 15 minutes dans ce cas, malgré le délai d'attente défini, pourquoi cela se produit-il? L'appel ne doit être effectué qu'une seule fois, comment puis-je définir wget sur NON réessayer? Je sais que vous pouvez définir, …
11 linux  rhel  wget 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.