Re: Ordnung in Datensalat bringen

To: MLDEB - German <debian-user-german@lists.debian.org>
Subject: Re: Ordnung in Datensalat bringen
From: Thomas Vollmer <thomas-ml@vollmeronline.de>
Date: Sun, 4 Jul 2004 20:04:59 +0200
Message-id: <[🔎] 200407042005.20584.thomas-ml@vollmeronline.de>
In-reply-to: <[🔎] 20040704085327.GA31838@riser.jnet.local>
References: <[🔎] 200407031555.33963.colonius@free.fr> <[🔎] 20040703205827.GQ31891@freenet.de> <[🔎] 20040704085327.GA31838@riser.jnet.local>

On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> > Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> > >Michelle Konzack schrieb am 03.07.2004 22:30:

Hi,

[...]

> Also sowas mach ich auch:
>
> find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> double.txt
>
> Dauert bei 80 GB gaaanz schön lang.

außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur 
bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF 
Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur 
vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur 
mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien 
deren Hash sich aber durchaus unterscheidet.

Gruß
	Thomas

-- 
IRC: TomseDive	Jabber: tomse@jabber.org	ICQ: 4843585

Attachment: pgpVuFLeRahYa.pgp
Description: PGP signature

Reply to:

Follow-Ups:
- Re: Ordnung in Datensalat bringen
  - From: Joerg.Rieger@informatik.med.uni-giessen.de (Joerg Rieger)

References:
- Ordnung in Datensalat bringen
  - From: Klaus Becker <colonius@free.fr>
- Re: Ordnung in Datensalat bringen
  - From: Michelle Konzack <linux4michelle@freenet.de>
- Re: Ordnung in Datensalat bringen
  - From: Joerg.Rieger@informatik.med.uni-giessen.de (Joerg Rieger)

Prev by Date: Re: Zeichenfolge mit sed aus einer Zeile loeschen
Next by Date: Re: shutdown im gdm für alle user
Previous by thread: Re: Ordnung in Datensalat bringen
Next by thread: Re: Ordnung in Datensalat bringen
Index(es):
- Date
- Thread