Je n'ai aucune expérience avec btrfs, mais il est annoncé pour pouvoir dé-dupliquer des fichiers.
Dans mon application, je devrais dupliquer des arborescences de répertoires entières.
D'après ce que j'ai appris, btrfs ne dédoublonne que dans certains post-scan, pas immédiatement. Même une simple utilisation cp
ne semble pas déclencher de déduplication (au moins, df
montre une utilisation accrue du disque dans la taille des fichiers copiés).
Puis-je éviter de déplacer complètement les données et dire btrfs
directement de dupliquer un fichier à un autre emplacement, essentiellement en clonant simplement ses métadonnées?
Essentiellement, semblable à un lien physique, mais avec des métadonnées indépendantes (autorisations, heures de modification, ...).
cp --reflink=always
, le résultat du point de vue de l'utilisateur sera deux fichiers complètement indépendants dans tous les sens. Le fait que le système de fichiers sous-jacent en déduit que via la copie sur écriture n'est qu'un détail d'implémentation. Vous n'obtenez pas "un lien dur, mais avec des métadonnées indépendantes". À ma connaissance, btrfs ne fait pas encore de déduplication automatique. Je pense que c'est un plan futur, mais je ne suis pas positif à ce sujet.
cp --reflink=always
.