Re: trovare i file duplicati

To: debian-italian@lists.debian.org
Subject: Re: trovare i file duplicati
From: Davide Alberani <alberanid@libero.it>
Date: Mon, 21 Jun 2004 17:18:24 +0200
Message-id: <[🔎] 20040621151824.GA1017@libero.it>
Mail-followup-to: Davide Alberani <alberanid@libero.it>, debian-italian@lists.debian.org
In-reply-to: <[🔎] 20040621.143407.57437272.giorgian@giorgian.widge.org>
References: <[🔎] 20040621.143407.57437272.giorgian@giorgian.widge.org>

On Jun 21, Pietro Giorgianni <giorgian@interfree.it> wrote:

> per  ogni file,  devo  controllare se  questo  file di  testo
> e`  gia` presente in un'altra  directory (chiamata grande), non
> necessariamente con lo stesso nome, e se si`, cancellarlo.

Miracoli non si fanno; mi sa che ti tocca confrontare ogni singolo
file della prima directory con ogni file della seconda.

Come puoi immaginare uno script cosi` "brute force" e` banale;
resta da vedere se il contenuto delle due directory e` inferiore
alla quantita` di RAM (usata come cache) della macchina.
Se si`, direi che il tutto non dovrebbe poi prendere piu` di
tanto tempo anche per un numero molto elevato di file, altrimenti
potrebbe essere una idea usare un hash (per esempio usando md5sum):
ti crei due liste che associano i file nelle due directory con i
rispettivi hash, poi scrivi uno scriptino che controlli che gli
hash della prima lista siano nella seconda (e che ti segnali i
nomi dei file non presenti).

-- 
Davide Alberani <alberanid@libero.it> [PGP KeyID: 0x465BFD47]
http://erlug.linux.it/~da/

Reply to:

References:
- trovare i file duplicati
  - From: Pietro Giorgianni <giorgian@interfree.it>

Prev by Date: Re: problema NAT
Next by Date: Re: Scheda TV e modulo SAA7134
Previous by thread: trovare i file duplicati
Next by thread: Re: trovare i file duplicati
Index(es):
- Date
- Thread