Réponses:
Commencez par faire une sauvegarde complète afin que si quelque chose ne va pas, vous n'avez rien perdu.
Je crois que vous cherchez duperemove -d
"Duperemove est un outil simple pour trouver des extensions dupliquées et les soumettre à la déduplication. Lorsqu'on lui donne une liste de fichiers, il hache leur contenu bloc par bloc et compare ces hachages les uns aux autres, en trouvant et en catégorisant les extensions qui se correspondent. Lorsque l'option -d est donnée, duperemove soumet ces extensions pour la déduplication à l'aide de l'ioctl btrfs-extend-same.
Duperemove a deux modes de fonctionnement principaux, l'un étant un sous-ensemble de l'autre.
Mode lecture seule / sans déduplication
Lorsqu'il est exécuté sans -d (valeur par défaut), duperemove imprimera une ou plusieurs tables d'extensions correspondantes qu'il a déterminées comme étant des candidats idéaux pour la déduplication. Par conséquent, le mode lecture seule est utile pour voir ce que duperemove peut faire lorsqu'il est exécuté avec '-d'. La sortie pourrait également être utilisée par d'autres logiciels pour soumettre les extensions pour la déduplication à une date ultérieure.
Il est important de noter que ce mode n'imprimera pas toutes les instances d'extensions correspondantes, uniquement celles qu'il envisagerait pour la déduplication.
Généralement, duperemove ne se préoccupe pas de la représentation sous-jacente des étendues qu'il traite. Certains d'entre eux pourraient être compressés, subir des E / S ou même avoir déjà été dédupliqués. En mode de déduplication, le noyau gère ces détails et nous essayons donc de ne pas répliquer ce travail.
Mode de déduplication
Cela fonctionne de manière similaire au mode lecture seule, à l'exception du fait que les extensions dupliquées trouvées dans notre étape "lire, hacher et comparer" seront réellement soumises pour déduplication. Une estimation du total des données dédupliquées sera imprimée une fois l'opération terminée. Cette estimation est calculée en comparant la quantité totale d'octets partagés dans chaque fichier avant et après la déduplication.
Consultez la page de manuel duperemove pour plus de détails sur l'exécution de duperemove. "
cela ne semble pas apparaître dans le package btrfs-tools mais il y a une page git hub ici. Problèmes récents ouverts et fermés (aka pulse) disponibles ici.
Les packages pour toutes les versions actuellement prises en charge d'Ubuntu peuvent être trouvés dans ce PPA
Je dois réitérer que la sauvegarde est fortement recommandée . Voir: https://github.com/markfasheh/duperemove/issues/50
Source citée: https://github.com/markfasheh/duperemove
page de manuel: https://manpages.debian.org/testing/duperemove/duperemove.8.fr.html
duperemove [options] files...
duperemove -rdh path1 path2 pathn
, où -r
pour récursif, -d
réellement dédupliquer, et -h
pour les nombres lisibles par l'homme.
J'ai toujours utilisé bedup . C'est très rapide et fiable. Cet outil est également mentionné sur la page officielle de btrfs . Je n'ai jamais utilisé duperemove (bedup est plus ancien).