Fondamentalement, je cherche à voir s'il existe un outil ou un script qui peut détecter les fichiers déplacés ou renommés afin que je puisse obtenir une liste de fichiers renommés / déplacés et appliquer la même opération à l'autre extrémité du réseau pour économiser la bande passante.
Fondamentalement, le stockage sur disque est bon marché, mais la bande passante ne l'est pas, et le problème est que les fichiers seront souvent réorganisés ou déplacés dans une meilleure structure de répertoires.Par conséquent, lorsque vous utilisez rsync pour effectuer la sauvegarde, rsync ne remarquera pas qu'il s'agit d'un fichier renommé ou déplacé le fichier et le retransmettre sur le réseau à nouveau malgré le même fichier à l'autre extrémité.
Je me demande donc s'il existe un script ou un outil qui peut enregistrer où se trouvent tous les fichiers et leurs noms, puis juste avant une sauvegarde, il réanalyserait et détecterait les fichiers déplacés ou renommés, alors je peux prendre cette liste et réappliquer l'opération déplacer / renommer de l'autre côté.
Voici une liste des fonctionnalités "générales" des fichiers:
- Grands fichiers immuables
- Ils peuvent être renommés ou déplacés
[Modifier:] Ce sont toutes de bonnes réponses, et ce que je finis par faire à la fin était de regarder toutes les réponses et j'écrirai du code pour y faire face. Fondamentalement, ce à quoi je pense / travaille actuellement:
- Utiliser quelque chose comme AIDE pour l'analyse "initiale" et me permettre de garder des sommes de contrôle sur les fichiers car ils sont censés ne jamais changer, donc cela aiderait à détecter la corruption.
- Créer un démon inotify qui surveillerait ces fichiers / répertoires et enregistrer toutes les modifications relatives aux renommages et déplacer les fichiers vers un fichier journal.
- Il existe certains cas marginaux où inotify peut ne pas enregistrer que quelque chose est arrivé au système de fichiers, il y a donc une dernière étape d'utilisation de la recherche pour rechercher dans le système de fichiers les fichiers dont le temps de modification est supérieur à la dernière sauvegarde .
Cela présente plusieurs avantages:
- Somme de contrôle / etc de AIDE pour pouvoir vérifier / s'assurer que certains médias ne sont pas corrompus
- Inotify réduit l'utilisation des ressources et n'a pas besoin de réanalyser le système de fichiers encore et encore
- Pas besoin de patcher rsync; Si je dois patcher des choses que je peux, mais je préférerais éviter de patcher des choses pour réduire la charge (IE n'a pas besoin de re-patcher chaque fois qu'il y a une mise à jour).
- J'ai déjà utilisé Unison et c'est vraiment sympa, mais j'aurais juré qu'Unison garde des copies sur le système de fichiers et que ses fichiers "archive" peuvent devenir assez gros?