[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

grave probleme RAID 10 ne s'assemble plus après maj



Bonjour à tous

J'ai un sérieux problème de Raid 10 (logiciel) sur un serveur DELL. 
Après une mise à jour du kernel, et un reboot on m'a téléphoné pour me dire 
que le système ne démarrait pas. Le prompt proposait de sauter le montage de 
cetaines partitions. J'ai dit OK. 
Ensuite j'ai pris la main (ssh):
- il y a une erreur du driver mpt2sas (carte LSI ou "PERC" chez Dell), mais 
qui semble juste "cosmétique" d'après ce que j'ai pêché sur le net
- plein de Buffer I/O error on device dm-1, logical block 12206064
- encore plus de EXT4-fs error (device dm-1): ext4_read_inode_bitmap: Cannot 
read inode bitmap - block_group = 320, inode_bitmap = 10485776
Ce qui est bizarre parce que les partitions ne sont pas montées (sauf / qui 
est sur carte ssd hors raid).

Toutes les partitions Raid 10 sont marquées "inactive" dans /proc/mdstat
Le superblock de l'une d'elle n'existe plus (selon mdadm -Av)

Je suis un peu embêté, je n'ai jamais eu ça, et on me met la pression pour 
que ça remarche vite... 
J'ai 2 soucis:
je ne comprend pas ce qui a pu se passer
et je ne comprend pas exactement la situation, ce qui m'empêche de faire ce 
qu'il faut: 
- Pourquoi "inactive"? je n'ai jamais vu ça avant ou je n'y a jamais prêté 
attention. La doc du Raid Linux étant ce qu'elle est, je ne trouve pas 
l'info.
- Me faut-il recréer le superblock manquant sur la partition ou bien 
réassembler le raid en dégradé avec une partition fautive pour qu'elle soit 
recréée?

Et pour comprendre:
- les disques sont neufs, il n'y a eu aucune alerte, je doute que ce soit un 
problème physique (d'ailleurs les outils de diagnostic smart, pour ce qu'ils 
valent (cf papiers de Google en 2008) n'indiquent rien.
- il y a une partition spare, pourquoi mdadm ne s'est-il pas rabattu dessus?


Merci pour vos lumières

xavier



Reply to: