Re: Ordnung in Datensalat bringen

To: debian-user-german@lists.debian.org
Subject: Re: Ordnung in Datensalat bringen
From: Dieter Franzke <lists@eyenovation.de>
Date: Sun, 4 Jul 2004 20:34:38 +0200
Message-id: <[🔎] 200407042034.38494.lists@eyenovation.de>
In-reply-to: <[🔎] 20040704182303.GA1627@riser.jnet.local>
References: <[🔎] 200407031555.33963.colonius@free.fr> <[🔎] 200407042005.20584.thomas-ml@vollmeronline.de> <[🔎] 20040704182303.GA1627@riser.jnet.local>

Hi,

On Sunday 04 July 2004 20:23, Joerg Rieger wrote:
> On Sun, Jul 04, 2004 at 08:04:59PM +0200, Thomas Vollmer wrote:
> > On Sunday 04 July 2004 10:53, Joerg Rieger wrote:
> > > On Sat, Jul 03, 2004 at 10:58:28PM +0200, Michelle Konzack wrote:
> > > > Am 2004-07-03 22:50:36, schrieb Rainer Bendig, Digitally Impressed:
> > > > >Michelle Konzack schrieb am 03.07.2004 22:30:
> >
> > [...]
> >
> > > Also sowas mach ich auch:
> > >
> > > find . -exec md5sum {} 2>/dev/null \; | sort | uniq -W 1 -D >
> > > double.txt
> > >
> > > Dauert bei 80 GB gaaanz schön lang.
> >
> > außerdem hat der Ansatz ein weiteres Problem. Er findet Doubletten nur
> > bei 100%iger  Gleichheit. Man denke mal an JPEGs bei denen mal der EXIF
> > Header angefasst wurde, das Bild gedreht oder eine Farbkorrektur
> > vorgenommen wurde. Oder diverse Officeformate wo bei einer Version nur
> > mal auf Speichern gedrückt wurde. Dies sind inhaltlich gleiche Dateien
> > deren Hash sich aber durchaus unterscheidet.
>
> Das ist richtig. Nur würde es ungleich aufwendiger, wenn man, wie in
> deinen Beispielen, noch solche Fälle berücksichtigen würde.

für so etwas gibt es auch fertiges:
filedupe, läuft bei mir unter BSD.
Ob es ein .deb gibt entzieht sich im Moment meiner Kenntnis....


ciao


dieter

Reply to:

Follow-Ups:
- Re: Ordnung in Datensalat bringen
  - From: Joerg.Rieger@informatik.med.uni-giessen.de (Joerg Rieger)

References:
- Ordnung in Datensalat bringen
  - From: Klaus Becker <colonius@free.fr>
- Re: Ordnung in Datensalat bringen
  - From: Thomas Vollmer <thomas-ml@vollmeronline.de>
- Re: Ordnung in Datensalat bringen
  - From: Joerg.Rieger@informatik.med.uni-giessen.de (Joerg Rieger)

Prev by Date: Re: Ordnung in Datensalat bringen
Next by Date: Re: subversion Abwärtskompatibel zu cvs?
Previous by thread: Re: Ordnung in Datensalat bringen
Next by thread: Re: Ordnung in Datensalat bringen
Index(es):
- Date
- Thread