J'ai besoin de fichiers à télécharger dans / tmp / cron_test /. Mon code wget est
wget --random-wait -r -p -nd -e robots=off -A".pdf" -U mozilla http://math.stanford.edu/undergrad/
Y a-t-il donc un paramètre pour spécifier le répertoire?
J'ai besoin de fichiers à télécharger dans / tmp / cron_test /. Mon code wget est
wget --random-wait -r -p -nd -e robots=off -A".pdf" -U mozilla http://math.stanford.edu/undergrad/
Y a-t-il donc un paramètre pour spécifier le répertoire?
Réponses:
Depuis la page de manuel:
-P prefix
--directory-prefix=prefix
Set directory prefix to prefix. The directory prefix is the
directory where all other files and sub-directories will be
saved to, i.e. the top of the retrieval tree. The default
is . (the current directory).
Vous devez donc ajouter -P /tmp/cron_test/
(forme courte) ou --directory-prefix=/tmp/cron_test/
(forme longue) à votre commande. Notez également que si le répertoire n'existe pas, il sera créé.
--no-host-directories
ou -nH
selon serverfault.com/questions/354792/…
-O est l'option permettant de spécifier le chemin d'accès du fichier vers lequel vous souhaitez télécharger.
wget <file.ext> -O /path/to/folder/file.ext
-P est le préfixe où il va télécharger le fichier dans le répertoire
wget <file.ext> -P /path/to/folder
/path/to/folder/
là
-O
ce dont je n'avais pas besoin, mais m'a fait sentir plus confiant que -P
c'était ce dont j'avais besoin.
-O
remplace -P
, donc vous ne pouvez pas spécifier uniquement le répertoire de sortie (pensez dirname
et juste le nom du fichier de sortie (pensez basename
). Pour cette utilisation, -O
spécifiez simplement le chemin d'accès complet au fichier.
Assurez-vous que l'URL est correcte pour tout ce que vous téléchargez. Tout d'abord, les URL avec des caractères comme?
et tels ne peuvent pas être analysées et résolues. Cela confondra la ligne cmd et acceptera tous les caractères qui ne sont pas résolus dans le nom de l'URL source comme nom de fichier dans lequel vous téléchargez.
Par exemple:
wget "sourceforge.net/projects/ebosse/files/latest/download?source=typ_redirect"
va télécharger dans un fichier nommé, ?source=typ_redirect
.
Comme vous pouvez le voir, connaître une ou deux choses sur les URL aide à comprendre wget
.
Je démarre à partir d'un disque hirens et je n'avais que Linux 2.6.1 comme ressource (le système d'exploitation d'importation n'est pas disponible). La syntaxe correcte qui a résolu mon problème de téléchargement d'une image ISO sur le disque dur physique était:
wget "(source url)" -O (directory where HD was mounted)/isofile.iso"
On pourrait trouver l'URL correcte en trouvant à quel moment les wget
téléchargements dans un fichier nommé index.html
(le fichier par défaut), et a la taille correcte / d'autres attributs du fichier dont vous avez besoin, indiqués par la commande suivante:
wget "(source url)"
Une fois que l'URL et le fichier source sont corrects et qu'ils sont téléchargés dans index.html
, vous pouvez arrêter le téléchargement ( ctrl+ z) et modifier le fichier de sortie en utilisant:
-O "<specified download directory>/filename.extension"
après l'URL source.
Dans mon cas, cela se traduit par le téléchargement d'une image ISO et son stockage sous forme de fichier binaire sous isofile.iso
, qui, espérons-le, se monte.
"-P" est la bonne option, veuillez lire la suite pour plus d'informations connexes:
wget -nd -np -P / dest / dir - récursif http: // url / dir1 / dir2
Extraits pertinents des pages de manuel pour plus de commodité:
-P prefix
--directory-prefix=prefix
Set directory prefix to prefix. The directory prefix is the directory where all other files and subdirectories will be saved to, i.e. the top of the retrieval tree. The default is . (the current directory).
-nd
--no-directories
Do not create a hierarchy of directories when retrieving recursively. With this option turned on, all files will get saved to the current directory, without clobbering (if a name shows up more than once, the
filenames will get extensions .n).
-np
--no-parent
Do not ever ascend to the parent directory when retrieving recursively. This is a useful option, since it guarantees that only the files below a certain hierarchy will be downloaded.
man wget: -O fichier --output-document = fichier
wget "url" -O /tmp/cron_test/<file>