Que puis-je utiliser pour rechercher des photos en double, y compris des photos redimensionnées?
Que puis-je utiliser pour rechercher des photos en double, y compris des photos redimensionnées?
Réponses:
Ajoutez toutes les photos à votre collection. Dans le menu, sélectionnez «Outils / Rechercher les doublons». Cela recherchera les doublons dans toute votre collection.
Un outil de ligne de commande. Passez toutes les images que vous souhaitez comparer sur la ligne de commande.
Dans le menu, sélectionnez «Fichier / Rechercher une copie». Faites glisser et déposez les fichiers d’image pour dupliquer la fenêtre. Vous pouvez supprimer des répertoires pour ajouter leur contenu de manière récursive. Pour la comparaison visuelle des images, un menu déroulant contient des options spécifiques, autres que les options par défaut. Le niveau de similarité "personnalisé" permet de restreindre les associations uniquement au degré de similitude le plus élevé, mais il doit être défini sur "Préférences" sur 99. Même dans ce cas, cela ne fonctionne pas parfaitement, du moins pour certains types d’images, comme les art. Malheureusement, il ne fournit pas de mécanisme de sélection automatique avec des critères rationnels, tels que la résolution, la date ou autre, la sélection automatique semble ne prendre que la première image trouvée comme référence à préserver. La suppression de nombreuses images peut être extrêmement lente, car elle tente de mettre à jour le nombre de résultats à chaque suppression.
Ces trois outils trouvent des doublons visuels, pas seulement des fichiers octets identiques.
fslint
est un programme graphique capable de trouver des fichiers en double de tout type avec md5sum. Si les images ne sont pas identiques, elles ne seront pas marquées comme des doublons. L'image ci-dessous montre plusieurs fichiers pdf en double dans le répertoire Téléchargements:
Vous pouvez modifier les paramètres de recherche avancée pour rechercher par type de fichier et vous limiter aux images. Cela se fait en modifiant les "paramètres de recherche supplémentaires" en tant find
qu'options de commande. Par exemple, ici, je ne cherche que des *.jpg
fichiers (dans le même chemin, uniquement dans mon dossier "Téléchargements":
fdupes
est un outil équivalent basé sur la ligne de commande. Les deux sont disponibles dans les pensions.
Vous pouvez utiliser un outil de ligne de commande appelé fdupes
pour rechercher les fichiers en double (voir man fdupes
pour plus de détails). Je ne connais aucun moyen de trouver des «doublons» qui ont été redimensionnés. Un programme faisant cela nécessiterait une sorte d'algorithme intelligent qui analyserait le contenu de l'image car, lorsqu'une image est redimensionnée, ses données sont modifiées, de sorte que les méthodes de recherche de doublons traditionnelles ne fonctionnent pas.
imgSeek peut trouver des doublons ainsi que des images similaires (il devrait donc être capable de trouver des photos redimensionnées et des photos avec des noms de fichier et des métadonnées différents) et même de rechercher des photos sur la base d'un croquis. Il est disponible dans les versions de bureau et serveur.
Je n'ai pas vraiment essayé moi-même, cependant.
isk-daemon
fonctionne sur 12.04, bien que j’ai trouvé que j’avais à installer à partir du source ( pip install
selon la page d’installation ne fonctionnant pas)
DupeGuru Picture Edition fonctionne vraiment bien et vaut la peine d’être essayé.
Ils ont un PPA Launchpad , dupeguru
(nouveau package tout-en-un) ou dupeguru-pe
(ancien package édition d'image) peuvent être installés à partir de celui-ci à l'aide des commandes suivantes:
sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
Visipics est une application Windows gratuite pour cette fonction, mais fonctionne parfaitement sous Linux, via wine, bien entendu (c'est mieux que geeqie / gqview en ce qui concerne le tri des doublons (les résultats de geeqie sont absolument "non triables").
Vous pouvez lui dire de sélectionner automatiquement les images en fonction de critères tels que la taille réduite du fichier, le type non compressé, la résolution inférieure (cela ne fera pas le contraire, vous devrez le faire manuellement, ce qui ne serait pas beaucoup mieux que de le faire sur geeqie, sauf que la sélection ne nécessite pas de maintien Shift/ Ctrl), et même de hiérarchiser les dossiers (mais la dernière priorité est la priorité du dossier).
Vous devez faire attention aux liens symboliques, cependant - il peut "aléatoirement" choisir de sauvegarder un lien symbolique vers un fichier tout en supprimant le fichier réel en tant que "copie". C'est une honte.