wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Le fichier que vous téléchargez est une tar
archive (un fichier binaire), fournie par un lien dynamique à partir d'un serveur Web. wget
enregistrerait normalement le fichier en utilisant une partie de l'URL que vous utilisez, mais dans ce cas, il s'agit simplement d'un point de terminaison REST API (ou quelque chose de similaire), de sorte que le nom ne serait pas convivial avec lequel travailler (ce serait toujours un nom valide et le le contenu du fichier serait le même).
Cependant, dans ce cas, le serveur fournit un en-tête "Content Disposition" contenant le nom de fichier réel, qui wget
peut être utilisé si vous utilisez l' --content-disposition
option. Cette option est marquée "expérimentale" dans mon manuel pour wget
.
Vous devez également citer l'URL afin que le shell n'interprète pas les caractères &
et ?
.
La chose équivalente en utilisant curl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Ou, en utilisant les options longues équivalentes:
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Une fois le fichier téléchargé, vous devez le décompresser:
tar -xvf GSE48191_RAW.tar
En raison de la façon dont cette archive particulière a été créée, cela décompressera les fichiers de l'archive dans le répertoire actuel (donc créer un nouveau répertoire, y déplacer l'archive et la décompresser peut être une bonne idée). Les fichiers de cette archive sont des fichiers gzip
compressés CEL
.