J'essaie de télécharger deux sites à inclure sur un CD:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
Le problème que j'ai, c'est que ce sont deux wikis. Ainsi, lors du téléchargement avec par exemple:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
J'obtiens beaucoup de fichiers car il suit également des liens comme ...? Action = edit ...? Action = diff & version = ...
Quelqu'un connaît-il un moyen de contourner cela?
Je veux juste les pages actuelles, sans images, sans différences etc.
PS:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
Cela a fonctionné pour berkeley mais boinc-wiki.info me pose toujours des problèmes: /
PPS:
J'ai obtenu ce qui semble être les pages les plus pertinentes avec:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info