[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] Outil magic comparaison de fichiers



Le Tue, Jan 11, 2005 at 01:23:53PM +0100, philippe L écrivait/wrote:

> Je suis sous K3.4-2.6, et j'ai 20 g de fichiers,(2 DD de 10g), je
> voulais savoir si il existe un outil pour trouver les doublettes ?

Une solution approximative serait de calculer le md5sum de chaque
fichier, puis d'y detecter les doublons

  find * -type f -exec md5sum '{}' \; | sort > /tmp/listemd5

ensuite, dans la liste (triée) ainsi obtenue, cherchez les lignes
consecutives ayant la même clef, par exemple 
  awk '{if ($1==prec) print $0; prec=$1}' /tmp/listemd5

Stricto sensu, ca vous detecte les collisions de clefs md5. Mais en
pratique, celles-ci sont tellement rares que vous ne trouverez que les
fichiers aux contenus identiques.

-- 
Basile STARYNKEVITCH         http://starynkevitch.net/Basile/ 
email: basile<at>starynkevitch<dot>net 
aliases: basile<at>tunes<dot>org = bstarynk<at>nerim<dot>net
8, rue de la Faïencerie, 92340 Bourg La Reine, France



Reply to: