[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Перестал собираться md raid при загрузке.



Здравствуйте.

Debian Wheeze 8.0 (3.16-3-amd64), в которой 2 raid1 (зеркало) массива:
md0: sd{b,c}1
md1: sd{b,c}3

Примерно с месяц назад, через раз стал выпадать диск sdc (копия sdb) из	
массивов при загрузке.

Ругачек на диски нет.
Кусок kern.log для "разбитой" загрузке привожу ниже:

# инит 1-го диска
kernel: [    7.719215] scsi 2:0:0:0: Direct-Access     ATA      WDC WD4000AAKS-0 1C02 PQ: 0 ANSI: 5
kernel: [    7.719515] sd 2:0:0:0: [sdb] 781422768 512-byte logical blocks: (400 GB/372 GiB)
kernel: [    7.732664]  sdb: sdb1 sdb2 sdb3
kernel: [    7.733628] sd 2:0:0:0: [sdb] Attached SCSI disk

# неудачный запуск массива md1 (до инита всех дисков, составляющих массив)
kernel: [    8.344987] md: md1 stopped.
kernel: [    8.345499] md: bind<sdb3>
kernel: [    8.492907] md: raid1 personality registered for level 1
kernel: [    8.493280] md/raid1:md1: active with 1 out of 2 mirrors
kernel: [    8.493320] md1: detected capacity change from 0 to 393999024128
kernel: [    8.493939]  md1: unknown partition table

# инит 2-го диска
kernel: [    8.543808] scsi 4:0:0:0: Direct-Access     ATA      WDC WD4000AAKS-0 1C02 PQ: 0 ANSI: 5
kernel: [    8.544174] sd 4:0:0:0: [sdc] 781422768 512-byte logical blocks: (400 GB/372 GiB)
kernel: [    8.559318]  sdc: sdc1 sdc2 sdc3
kernel: [    8.559836] sd 4:0:0:0: [sdc] Attached SCSI disk

# неудачный запуск массива md0, причём в момент когда оба диска доступны
kernel: [    8.981260] md: md0 stopped.
kernel: [    8.982580] md: bind<sdb1>
kernel: [    8.983711] md/raid1:md0: active with 1 out of 2 mirrors
kernel: [    8.983736] md0: detected capacity change from 0 to 98566144
kernel: [    8.984272]  md0: unknown partition table

Прим:
  * На райдовых разделах (/dev/sd{b,c}{1,3}) стоит тип 0xFD (Linux raid autodetect).
  * Норм. загрузка бывает когда оба диска инициализируются до 1-й попытки md bind

mdadm.conf
# definitions of existing MD arrays
ARRAY /dev/md0 UUID=8f1d6116:8474f3a0:d417b99e:28a7727f
ARRAY /dev/md1 UUID=e2e0053f:10ba7fbe:ac344792:529157d0

Х.з. как назначаются UUID-ы в mdadm.conf, но первый (md0) совпадает с UUID sdc1
$ sudo blkid /dev/sdc1
/dev/sdc1: UUID="8f1d6116-8474-f3a0-d417-b99e28a7727f" TYPE="linux_raid_member" PARTUUID="aaaaaaaa-01" 

а второй md1 с sdb3
sudo blkid /dev/sdb3
/dev/sdb3: UUID="e2e0053f-10ba-7fbe-ac34-4792529157d0" TYPE="linux_raid_member" PARTUUID="30a230a1-03"

Может кто встречался с подобным? Помогите разобраться или определить на кого багрепорт послать,
на ядро или mdadm или ... может все решиться если убрать FD (Linux raid autodetect) с разделов (сцыкотно)?
Устал осколки склеивать почти через день.


Reply to: