[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

disque malade et lvm en mode mirror



Bonjour,

J'ai probablement un disque bien malade, et je doute de la meilleure solution pour m'en sortir
sans trop de pertes.

J'ai tout en lvm sauf /boot, avec un vg sur sda pour / et /home (wheezy avec grub sur sda), 
tous en ext4

- sda : ssd avec /boot, plus un vg pour les lv / et /home
- sdb : sata 2TB, pv lvm, utilisé dans un vg commun avec sdc
- sdc : sata 1TB dans le vg commun avec sdb

J'ai des lv en mirror, montés dans des dossiers de /, et d'autres sans mirror qui doivent donc être 
sur sdb (mais je laisse lvm faire sa cuisine).

Je suppose que la meilleure solution est de démonter toutes les partitions concernées 
(et les virer du fstab pour pouvoir rebooter), acheter un disque, l'ajouter dans le vg 
puis retirer le pv du disque malade, mais
- ça peut achever le disque malade, et je sais pas s'il y a une solution moins risquée.
- vaut-il mieux lancer fsck avant de toucher au lvm

Merci pour vos avis !




Question subsidiaire, j'ai lu http://www.admin-debian.com/les-systemes-de-fichiers-linux/lvm-2-logical-volume-management/ 
et http://debian-handbook.info/browse/stable/advanced-administration.html#sect.lvm, parcouru le man
mais si vous avez un lien vers de la doc qui explique comment récupérer les options de création des 
lv, et comment les modifier ensuite (lvs m'indique les lv en mirror, mais je sais pas trop interpréter 
tout ce que raconte lvmdump), ou comment optimiser / sécuriser le journal, je suis preneur.



Et les détails du pb :

Au boot, j'ai fsck qui me dit qu'il y a des pbs et qu'il va tenter de réparer, me dit qu'il y
arrive pas et qu'il faudra le faire manuellement, puis ça reste planté là avec des messages qui
sentent mauvais (toutes les 5~10s un nouveau message d'erreur I/O sans avoir de shell de maintenance).
Évidemment je les ai pas noté et plus sous les yeux, et ils sont pas dans les logs, mais ça 
ressemblait à ce que j'ai trouvé ensuite dans le syslog (pour le boot réussi)

ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata3.01: failed command: READ DMA EXT
ata3.01: cmd 25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
         res 51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
ata3.01: status: { DRDY ERR }
ata3.01: error: { UNC }


Maintenant, je peux voir dans syslog

Jun  4 06:34:50 quad kernel: [    1.821746] sd 3:0:0:0: [sdc] 1953525168 512-byte logical blocks: (1.00 TB/931 GiB)
Jun  4 06:34:50 quad kernel: [    1.821749] sd 2:0:1:0: [sdb] 3907029168 512-byte logical blocks: (2.00 TB/1.81 TiB)
Jun  4 06:34:50 quad kernel: [    1.821764] sd 2:0:0:0: [sda] 125045424 512-byte logical blocks: (64.0 GB/59.6 GiB)

1re surprise, il voit sdc, comme si l'avoir débranché dans le bios ne changait rien, 
mais pourtant ça a permis de booter... (peut-être un hasard mais c'est curieux)

Les erreurs arrivent ensuite

Jun  4 06:34:50 quad kernel: [    4.401704] EXT4-fs (dm-0): re-mounted. Opts: (null)
Jun  4 06:34:50 quad kernel: [    4.433963] EXT4-fs (dm-0): re-mounted. Opts: discard,barrier=1,errors=remount-ro
Jun  4 06:34:50 quad kernel: [    4.457868] loop: module loaded
Jun  4 06:34:50 quad kernel: [   11.246913] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jun  4 06:34:50 quad kernel: [   11.246989] ata3.01: failed command: READ DMA EXT
Jun  4 06:34:50 quad kernel: [   11.247050] ata3.01: cmd 25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
Jun  4 06:34:50 quad kernel: [   11.247051]          res 51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
Jun  4 06:34:50 quad kernel: [   11.247187] ata3.01: status: { DRDY ERR }
Jun  4 06:34:50 quad kernel: [   11.247242] ata3.01: error: { UNC }
Jun  4 06:34:50 quad kernel: [   11.260207] ata3.00: configured for UDMA/100
Jun  4 06:34:50 quad kernel: [   11.268829] ata3.01: configured for UDMA/133
Jun  4 06:34:50 quad kernel: [   11.268839] ata3: EH complete
Jun  4 06:34:50 quad kernel: [   11.282947] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jun  4 06:34:50 quad kernel: [   11.283014] ata3.01: failed command: READ DMA EXT
Jun  4 06:34:50 quad kernel: [   11.283080] ata3.01: cmd 25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
Jun  4 06:34:50 quad kernel: [   11.283081]          res 51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
Jun  4 06:34:50 quad kernel: [   11.283312] ata3.01: status: { DRDY ERR }
Jun  4 06:34:50 quad kernel: [   11.283398] ata3.01: error: { UNC }
Jun  4 06:34:50 quad kernel: [   11.296200] ata3.00: configured for UDMA/100
Jun  4 06:34:50 quad kernel: [   11.304861] ata3.01: configured for UDMA/133
Jun  4 06:34:50 quad kernel: [   11.304868] ata3: EH complete

... ça continue comme ça jusqu'à

Jun  4 06:34:50 quad kernel: [   13.190762] ata3.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jun  4 06:34:50 quad kernel: [   13.190865] ata3.01: failed command: READ DMA EXT
Jun  4 06:34:50 quad kernel: [   13.190957] ata3.01: cmd 25/00:08:b7:01:c0/00:00:12:00:00/f0 tag 0 dma 4096 in
Jun  4 06:34:50 quad kernel: [   13.190959]          res 51/40:00:b8:01:c0/40:00:12:00:00/f0 Emask 0x9 (media error)
Jun  4 06:34:50 quad kernel: [   13.191221] ata3.01: status: { DRDY ERR }
Jun  4 06:34:50 quad kernel: [   13.191307] ata3.01: error: { UNC }
Jun  4 06:34:50 quad kernel: [   13.204201] ata3.00: configured for UDMA/100
Jun  4 06:34:50 quad kernel: [   13.212685] ata3.01: configured for UDMA/133
Jun  4 06:34:50 quad kernel: [   13.212695] sd 2:0:1:0: [sdb] Unhandled sense code
Jun  4 06:34:50 quad kernel: [   13.212697] sd 2:0:1:0: [sdb]  Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Jun  4 06:34:50 quad kernel: [   13.212701] sd 2:0:1:0: [sdb]  Sense Key : Medium Error [current] [descriptor]
Jun  4 06:34:50 quad kernel: [   13.212705] Descriptor sense data with sense descriptors (in hex):
Jun  4 06:34:50 quad kernel: [   13.212707]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Jun  4 06:34:50 quad kernel: [   13.212716]         12 c0 01 b8 
Jun  4 06:34:50 quad kernel: [   13.212720] sd 2:0:1:0: [sdb]  Add. Sense: Unrecovered read error - auto reallocate failed
Jun  4 06:34:50 quad kernel: [   13.212725] sd 2:0:1:0: [sdb] CDB: Read(10): 28 00 12 c0 01 b7 00 00 08 00
Jun  4 06:34:50 quad kernel: [   13.212733] end_request: I/O error, dev sdb, sector 314573240
Jun  4 06:34:50 quad kernel: [   13.212837] device-mapper: raid1: Primary mirror (254:1) failed while out-of-sync: Reads may fail.
Jun  4 06:34:50 quad kernel: [   13.212976] device-mapper: raid1: Read failure on mirror device 254:1.  Failing I/O.
Jun  4 06:34:50 quad kernel: [   13.213109] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.213200] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.213301] ata3: EH complete
Jun  4 06:34:50 quad kernel: [   13.213308] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.213414] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.213679] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.213771] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.213878] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.213970] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214075] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.214167] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214272] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.214364] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214468] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.214560] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.214666] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.214758] Buffer I/O error on device dm-3, logical block 39321592
Jun  4 06:34:50 quad kernel: [   13.214870] device-mapper: raid1: Mirror read failed.
Jun  4 06:34:50 quad kernel: [   13.214962] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   13.215068] Buffer I/O error on device dm-3, logical block 39321599

En résumé ça donne 
Jun  4 06:34:50 quad kernel: [   13.212701] sd 2:0:1:0: [sdb]  Sense Key : Medium Error [current] [descriptor]
Jun  4 06:34:50 quad kernel: [   13.212720] sd 2:0:1:0: [sdb]  Add. Sense: Unrecovered read error - auto reallocate failed
Jun  4 06:34:50 quad kernel: [   13.212733] end_request: I/O error, dev sdb, sector 314573240
Jun  4 06:34:50 quad kernel: [   13.213200] Buffer I/O error on device dm-3, logical block 39321599
[répété 7 fois]
Jun  4 06:34:50 quad kernel: [   13.215068] Buffer I/O error on device dm-3, logical block 39321599
Jun  4 06:34:50 quad kernel: [   61.572741] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: errors=remount-ro
Jun  4 06:34:50 quad kernel: [   61.640486] JBD2: IO error reading journal superblock
Jun  4 06:34:50 quad kernel: [   61.640578] EXT4-fs (dm-3): error loading journal
Jun  4 06:34:50 quad kernel: [   69.579744] EXT4-fs (dm-8): warning: mounting fs with errors, running e2fsck is recommended

Jun  4 06:39:37 quad kernel: [  369.632009] EXT4-fs (dm-8): error count: 5
Jun  4 06:39:37 quad kernel: [  369.632013] EXT4-fs (dm-8): initial error at 1401703303: __ext4_get_inode_loc:3678: inode 68207603: block 272632927 
Jun  4 06:39:37 quad kernel: [  369.632018] EXT4-fs (dm-8): last error at 1401797435: __ext4_get_inode_loc:3678: inode 76686780: block 306709115

dm-3 est un lv en mirror, dm-8 sur sdb

-- 
Daniel

Il y a trois temps qui déplaisent souverainement aux jardiniers : 
le temps sec, le temps pluvieux et le temps en général.
Pierre Daninos


Reply to: