Un autre bon outil est fslint
:
fslint est un ensemble d'outils permettant de rechercher divers problèmes liés aux systèmes de fichiers, notamment les fichiers en double, les noms de fichiers problématiques, etc.
Des outils de ligne de commande individuels sont disponibles en plus de l'interface graphique. Pour y accéder, vous pouvez modifier ou ajouter à $ PATH le répertoire / usr / share / fslint / fslint lors d'une installation standard. Chacune de ces commandes de ce répertoire a une option --help qui détaille ses paramètres.
findup - find DUPlicate files
Sur les systèmes basés sur Debian, vous pouvez l’installer avec:
sudo apt-get install fslint
Vous pouvez également le faire manuellement si vous ne voulez pas ou ne pouvez pas installer d'outils tiers. La plupart des programmes fonctionnent en calculant les sommes de contrôle des fichiers . Les fichiers avec le même md5sum contiennent presque certainement exactement les mêmes données. Donc, vous pourriez faire quelque chose comme ça:
find / -type f -exec md5sum {} \; > md5sums
gawk '{print $1}' md5sums | sort | uniq -d > dupes
while read d; do echo "---"; grep $d md5sums | cut -d ' ' -f 2-; done < dupes
Exemple de sortie (les noms de fichier dans cet exemple sont les mêmes, mais cela fonctionnera également s'ils sont différents):
$ while read d; do echo "---"; grep $d md5sums | cut -d ' ' -f 2-; done < dupes
---
/usr/src/linux-headers-3.2.0-3-common/include/linux/if_bonding.h
/usr/src/linux-headers-3.2.0-4-common/include/linux/if_bonding.h
---
/usr/src/linux-headers-3.2.0-3-common/include/linux/route.h
/usr/src/linux-headers-3.2.0-4-common/include/linux/route.h
---
/usr/src/linux-headers-3.2.0-3-common/include/drm/Kbuild
/usr/src/linux-headers-3.2.0-4-common/include/drm/Kbuild
---
Ce sera beaucoup plus lent que les outils dédiés déjà mentionnés, mais cela fonctionnera.