16

Je voudrais pouvoir faire une version hors ligne d'un site MediaWiki sur une base hebdomadaire.

L' extension DumpHTML fait en fait ce que je veux, car elle vide tous les articles et fichiers multimédias, mais je ne peux voir aucun index de tous les articles qu'elle a vidés, donc je ne peux pas naviguer dans le vidage.

En lisant la fonctionnalité de vidage XML de MediaWiki, je me demande s'il serait possible d'utiliser un programme pour afficher ces fichiers ou peut-être les convertir en html?

Ou existe-t-il d'autres façons de créer une version hors ligne d'un site MediaWiki?

mediawiki

— Sandra Schlichting
source

Avez-vous vraiment besoin d'un index? Commencez par Main Pagesuivre les liens à partir de là.

— Ilmari Karonen

Voici les instructions de Cam Webb pour créer une version statique d'un site MediaWiki. Voici les miens , au cas où ils aideraient quelqu'un. Les deux donnent des liens vers le résultat statique (le mien ici ).

— Michael Allan

8

Vous pouvez utiliser un outil Webcrawler qui enregistrera le site sous forme de fichiers HTML. Tous les liens seront convertis, vous pouvez donc ouvrir la page principale, par exemple, puis cliquer sur les liens et accéder à tout le site.

Plusieurs de ces outils sont disponibles. J'utilise wget , qui est basé sur la ligne de commande et a des milliers d'options, donc pas très convivial. Cependant, il est assez puissant.

Par exemple, voici la ligne de commande que j'ai utilisée pour vider mon propre site mediawiki. Je vous suggère de comprendre chaque option avant de l'utiliser vous-même:

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

— paulmorriss
source

10

Vous pouvez prendre le -pages-articles.xml.bz2sur le site de décharges de Wikimedia et les traiter avec WikiTaxi (télécharger dans le coin supérieur gauche). L'outil d'importation Wikitaxi créera un .taxifichier (environ 15 Go pour Wikipedia) à partir du .bz2fichier. Ce fichier sera utilisé par le programme WikiTaxi pour rechercher des articles. L'expérience est très similaire à l'expérience du navigateur.

Ou vous pouvez utiliser Kiwix , plus rapide à configurer car il fournit également les vidages ( .zimfichiers) déjà traités . Comme le commentaire le spécifie afin de pouvoir utiliser d'autres sites MediaWiki pour kiwix mwoffliner, cela peut ne pas fonctionner avec tous car ils peuvent avoir des différences personnalisées mais c'est la seule variante que j'ai rencontrée.

Prendre des trucs Wikimedia wgetn'est pas une bonne pratique. Si trop de gens le font, cela peut inonder les sites de demandes.

^{Modifier plus tard pour le cas où vous souhaitez également les images hors ligne:}

Projet XOWA

Si vous voulez un miroir complet de Wikipédia (y compris les images), le formatage HTML complet sera téléchargé en 30 heures environ , vous devez utiliser:

Wikipedia anglais a beaucoup de données. Il y a 13,9+ millions de pages avec 20,0+ Go de texte, ainsi que 3,7+ millions de miniatures.

XOWA :

La configuration de tout cela sur votre ordinateur ne sera pas un processus rapide ... L'importation elle-même nécessitera 80 Go d'espace disque et cinq heures de traitement pour la version texte. Si vous souhaitez également des images, le nombre augmente jusqu'à 100 Go d'espace disque et 30 heures de temps de traitement. Cependant, lorsque vous aurez terminé, vous aurez une copie complète et récente de Wikipédia en anglais avec des images pouvant tenir sur une carte SD de 128 Go.

Mais la version hors ligne ressemble beaucoup à la version en ligne, comprend des photos, etc.: (J'ai testé l'article ci-dessous complètement hors ligne) entrez la description de l'image ici

^{Modification ultérieure si aucune des conditions ci-dessus ne s'applique:}

Si le wiki ne fait pas partie de Wikimedia ou n'a pas de vidage, il y a un projet sur github qui télécharge ce wiki en utilisant son API:

WikiTeam - Nous archivons les wikis, de Wikipédia aux plus petits wikis

— Eduard Florinescu
source

1

En cas de vidage d'une installation mediawiki personnalisée, XOWA est tout à fait capable de le faire (certains problèmes peuvent exister), l'article suivant xowa.org/home/wiki/App/Wiki_types/Wikia.com est très utile. L'utilisation de Kiwix avec des wikis personnalisés doit encore être testée (il faut d'abord vider le wiki avec github.com/kiwix/mwoffliner ou un autre outil)

— escalator

Comment vider un MediaWiki pour une utilisation hors ligne?

Projet XOWA

WikiTeam - Nous archivons les wikis, de Wikipédia aux plus petits wikis