Comment mettre à jour automatiquement un miroir de site Web avec des exceptions à certaines pages?


1

Je reproduis actuellement un site Web sur mon serveur. Le site lui-même est rarement mis à jour, mais il est suffisamment mis à jour pour que les informations deviennent rapidement obsolètes.

Je l'ai d'abord reflété avec wget, et cela a bien fonctionné, mais j'ai apporté quelques modifications:

  • Le fichier index.html d'origine utilisait des cadres, mais le site fournit également un fichier main.html, qui est essentiellement index.html mais sans cadre. J'ai supprimé index.html et renommé main.html.
  • Je ne voulais pas refléter le webchat, le blog ou le forum, j'ai donc supprimé ces fichiers et répertoires et créé des répertoires "blogs" "forum" et "chat" et placé une redirection php dans chacun de ceux-ci, redirigeant les visiteurs vers le site original.

J'aimerais mettre à jour automatiquement le miroir (peut-être une fois toutes les 24 à 72 heures), tout en conservant les modifications apportées. Est-ce possible? Comment pourrais-je m'y prendre? Je ne sais absolument pas comment.

Merci pour toute aide! :)

Réponses:


0

Je suppose que vous utilisez wget --miror. Solutions possibles:

  1. Si les sections à conserver sont dans des répertoires, cela peut fonctionner:

    wget --exclude-directories=LIST

  2. Si vous pouvez le tolérer, vous autorisez la condition de concurrence critique, vous pouvez laisser wget écraser les éléments, puis les écraser avec un script qui les restaure.

  3. Empêcher l'écrasement des fichiers que vous ne souhaitez pas modifier.

    chmod 444 index.html

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.