[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Corruzione filesystem?



Salve a tutti,

Primo messaggio in lista, spero di non sbagliare a postare qua.

Cerco di spiegare brevemente la situazione e poi vado dritto al punto.

Ho due macchine, Fileserver e Backupserver.

Fileserver ha / su SSD, e /storage su un RAID 10 mdadm (/dev/md127) con 4 dischi da 1 TB.
Backupserver ha / su SSD, e un RAID 5 mdadm (/dev/md0) con 5 dischi da 1 TB come target iSCSI.

Backupserver mette a disposizione il target /dev/md0 a Fileserver via SCST.
Fileserver si connette al target con open-iscsi, e vede l'array come /dev/sdf, con unica partizione sdf1 e filesystem ext4. 

/dev/sdf1 è montato come /backup.

2 volte al giorno Fileserver esegue backup di /storage usando dirvish (quindi sostanzialmente rsync) su /backup.

Nei giorni scorsi ho sostituito i dischi da 1 TB con dischi da 4 TB.
Partizionati con gdisk, riaggiunti con mdadm uno ad uno, estendo l'array a 16 TB per Backupserver e ad 8 TB per Fileserver.

Fin qui, tutto bene.
Ora inizia la parte strana.

Vado per estendere il filesystem, e per scrupolo eseguo su Backupserver, con servizio SCST arrestato e quindi ad array smontato il comando fsck /dev/md0.

Il terminale risponde : 

fsck from util-linux 2.25.2
e2fsck 1.42.13 (17-May-2015)
ext2fs_open2: Valore magic non corretto nel super-blocco
fsck.ext2: Superblock invalid, trying backup blocks...
Super-blocco has an non valido journal (inode 8).
Azzera<s>? - rispondo no
fsck.ext2: Numero di inode non valido controllando il journal ext3 per /dev/md0

Quindi mi insospettisco e provo a montare in locale /dev/md0. Fallisce miseramente con il classico

mount: wrong fs type, bad option, bad superblock on /dev/md0,
       missing codepage or helper program, or other error

       In some cases useful info is found in syslog - try
       dmesg | tail or so.

Ripristino il link iSCSI, e stavolta da Fileserver eseguo fsck /dev/sdf (cioè l'array md0 di Backupserver)

Di nuovo :

fsck from util-linux 2.25.2
e2fsck 1.42.13 (17-May-2015)
ext2fs_open2: Valore magic non corretto nel super-blocco
fsck.ext2: Superblock invalid, trying backup blocks...
Super-blocco has an non valido journal (inode 8).
Azzera<s>? - rispondo no
fsck.ext2: Numero di inode non valido controllando il journal ext3 per /dev/sdf

DUBBIO ATROCE

Smonto /storage, e lancio fsck /dev/md127

fsck from util-linux 2.25.2
e2fsck 1.42.13 (17-May-2015)
ext2fs_open2: Valore magic non corretto nel super-blocco
fsck.ext2: Superblock invalid, trying backup blocks...
Super-blocco has an non valido journal (inode 8).
Azzera<s>? - rispondo no
fsck.ext2: Numero di inode non valido controllando il journal ext3 per /dev/md127

Provo a montare /dev/sdf1 su /backup e tutto funziona perfettamente.
Monto di nuovo /dev/md127 si /storage ed è tutto ok.
Riesco a vedere i file, a leggerli, a scrivere senza alcun problema.

Qualcuno ha idea di cosa stia succedendo, e dove o cosa stò sbagliando??
E anche se possa essere lontanamente intelligente dire a fsck di fare il suo lavoro?
E' possibile che fsck si sbagli, o è molto probabile che ci sia un problema?

I filesystem sono tutti EXT4.

Io per precauzione stò facendo il backup di tutto su un NAS, ma la cosa mi preoccupa.

Grazie a tutti
--
Marco Gregorio

Reply to: