Re: [HS] Outil magic comparaison de fichiers
Le Tue, Jan 11, 2005 at 01:23:53PM +0100, philippe L écrivait/wrote:
> Je suis sous K3.4-2.6, et j'ai 20 g de fichiers,(2 DD de 10g), je
> voulais savoir si il existe un outil pour trouver les doublettes ?
Une solution approximative serait de calculer le md5sum de chaque
fichier, puis d'y detecter les doublons
find * -type f -exec md5sum '{}' \; | sort > /tmp/listemd5
ensuite, dans la liste (triée) ainsi obtenue, cherchez les lignes
consecutives ayant la même clef, par exemple
awk '{if ($1==prec) print $0; prec=$1}' /tmp/listemd5
Stricto sensu, ca vous detecte les collisions de clefs md5. Mais en
pratique, celles-ci sont tellement rares que vous ne trouverez que les
fichiers aux contenus identiques.
--
Basile STARYNKEVITCH http://starynkevitch.net/Basile/
email: basile<at>starynkevitch<dot>net
aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net
8, rue de la Faïencerie, 92340 Bourg La Reine, France
Reply to: