[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Idee su come riparare il raid



Pol Hallen wrote:

> Ciao a tutti :-)
> Ho un raid 6 software su una debian stable.
Speriamo tu abbia una CPU potente... :)

> Mi sono accorto poco tempo fa di:
>  Active Devices : 7
> Working Devices : 9
>  Failed Devices : 0
>   Spare Devices : 2
Questo ci dice che bastano 6 dischi in vita (forse anche solo 5 essendo un
raid6) per non perdere i dati. 

>     Number   Major   Minor   RaidDevice State
>        0       8       64        0      active sync   /dev/sde
>        1       8      112        1      active sync   /dev/sdh
>        2       8       32        2      active sync   /dev/sdc
>        3       8       16        3      active sync   /dev/sdb
>        4       8       80        4      active sync   /dev/sdf
>        5       8      128        5      active sync   /dev/sdi
>        9       8        0        6      spare rebuilding   /dev/sda
>        7       8       96        7      active sync   /dev/sdg
>       10       8       48        8      spare rebuilding   /dev/sdd
>  
> dopo un po' si blocca tutto perche' /dev/sdh ha problemi, dmesg dice:
> 
> ata9.00: exception Emask 0x10 SAct 0x0 SErr 0x90000 action 0x2 frozen
> ata9.00: cmd c8/00:e0:20:1a:3d/00:00:00:00:00/e1 tag 0 cdb 0x0 data 114688
> in
>          res ff/ff:ff:ff:ff:ff/00:00:00:00:00/ff Emask 0x12 (ATA bus
>          error)
> ata9: hard resetting port
> ata9: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
> ata9.00: configured for UDMA/100
> ata9: EH complete
> sd 8:0:0:0: [sdh] 976773168 512-byte hardware sectors (500108 MB)
> sd 8:0:0:0: [sdh] Write Protect is off
> sd 8:0:0:0: [sdh] Mode Sense: 00 3a 00 00
> sd 8:0:0:0: [sdh] Write cache: enabled, read cache: enabled, doesn't
> support DPO or FUA
> ata9.00: exception Emask 0x10 SAct 0x0 SErr 0x90000 action 0x2 frozen
> 
> In sostanza ho: /dev/sdh che funziona male (quindi va sostituito) 
Boh, io non riesco ad interpretare quei logs, ma ad intuito mi sembra più un
problema del driver o del controller che un problema del disco. Prendi
comunque con molta diffidenza le mie impressioni.

> ma sia 
> sda e sdd sono in spare rebuilding
questo perché un disco funziona a singhiozzo, quindi il sistema prima si
pianta, poi quando riprende a funzionare inizia il rebuild dell'array. 
> 
> Se sostituisco sdh, il raid non dovrebbe piu' partire, no? 
Se togli un disco su sette. Gli altri due sono hot spare, quindi al momento
non contribuiscono a mantenere i dati fino a quando il rebuild non è
completo. Secondo me puoi togliere sdh, aggiungere un nuovo hot spare al
suo posto ed attendere il rebuild. Anche qui parlo per ricordi annebbiati,
quindi molta diffidenza ed un bel backup preventivo prima di agire...

Lucio.
-- 
Virtual Bit di Lucio Crusca
via Isonzo, 5 - 10069 Villar Perosa (TO) - Italy
http://www.virtual-bit.com


Reply to: