[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] Backup dati




Il 10/07/20 12:21, Mauro Morichi ha scritto:


Il 10/07/2020 10:27, Alessandro Baggi ha scritto:
mile al tuo, con checksum, quota, notifiche e comunicazioni.
Come hai implementato il checksum nel tuo script? Io sto provando a trovare una soluzione utilizzando l'md5 di rsync che si può ottenere usando l'opzione --output-format="%C e altri format per altre info". Questo è ottimo perche cmq l'hash lo calcola direttamente rsync e si risparmia un po di tempo, quindi per ogni file scaricato inserisco il rispettivo md5 in un manifest unico per il client contenente tutti i checksum dei file scaricati precedentemente. Il problema è che usando gli hardlink e utilizzando il prune, mi ritrovo a dover aggiornare una lista molto lunga ogni volta che effettuo un prune e questo richiede molto tempo. Al momento mi sono affidato a ZFS ma se non ho capito male il controllo di zfs consiste nel controllare se la copia live è cambiata rispetto a quella della parità senza che il file sia stato modificato nella copia live (anche perche se il file viene modificato nella copia live viene comunque aggiornato anche nel parity) (se sbaglio correggetemi).
anche se piu' lentamente utilizzo il tool esterno. Ogni volta genero un file con l'elenco di tutti gli md5 piu' altre info utili come spazio occupato, spazio disponibile, numero di backup presenti.... un po' di info leggibili, insomma.

Anche io ho provato con un tool esterno (sha512/256sum) ma quando sono molti file (tipo il primo backup o un aggiornamento di qualche giga) ci  mette un po. Per esempio il primo backup scarica circa 600000 file e  il processo per calcolare il checksum di ogni file richiede un bel po di tempo mentre invece utilizzando il checksum (md5 al momento) di rsync si perde solo il tempo di sincronizzazione dei file.


Reply to: