Degraded RAID5-Array nach HDD-Ausfall wieder in Betrieb nehmen
Hallo Liste,
ich suche Rat für eine Datenrettungsaktion. Jeder Vorschlag wird gern genommen.
Folgende Ausgangssituation:
- FileServer mit Debian Etch Samba Server Installation ohne Desktop.
- Ein Sockel 939 Board mit 4x SATA (Foxconn 6150BK8MC)
- 3x Samsung 320 GB T166 HD321KJ an den internen Anschlüssen
- Software-RAID
Folgende Filesystemaufteilung:
/boot ext3 raid1 sda1,sdb1,sdc1(spare) /dev/md0
swap swap sda2,sdb2,sdc2
/ ext3 raid5 sda5,sdb5,sdc5 /dev/md1
/home xfs raid5 sda6,sdb6,sdc6 /dev/md2
Ich habe gestern abend festgestellt, dass sda nicht mehr in den raid5-Arrays enthalten war. Die Arrays md1 und md2 waren clean, aber degraded.
Reboots klappten zu diesem Zeitpunkt noch. Die Daten waren verfügbar.
Ich dachte, ich könnte das Problem lösen, indem ich für die Partition hda5 ein re-add mache und somit wieder das Raid zum Laufen bekomme, also mdadm /dev/md1 --re-add /dev/sda5.
Das war ein Riesenfehler. Nach dieser Aktion kam ich beim Reboot nur noch in eine Hilfs-Shell, da das Array /dev/md1 nicht mehr gestartet werden konnte.
Den Ausgaben des Kernels nach, scheint jedoch /dev/md2 gestartet zu werden. Ich komme jedoch vom Etch-System nicht mehr heran, da ich ja kein / mehr habe.
Ich habe dann versucht mit Knoppix 5.2 zu booten und zu schauen, ob Knoppix ggf. /dev/md2 wieder in Betrieb nimmt - vielleicht eine Scan-Routine zum Boot-Zeitpunkt oder ähnliches.
Dies hat Knoppix leider nicht getan und da ich aber für's erste geheilt war, habe ich von weiteren Experimenten der Reparatur abgesehen.
Das System bootet mittlerweile gar nicht mehr von Platte. Ich vermute, dass Grub nur auf sda installiert war und Grub nun auch nicht mehr geladen werden kann.
Die /home Partition enthält jedoch eine Menge Daten, die ich nicht verlieren möchte. Deshalb die Fragen.
1. Gibt es eine empfehlenswerte Recovery-Distri, ggf. basierend auf Debian, die sich besonders zur Rettung von Daten eignet? Distrowatch nennt so einige Distributionen. Ich möchte allerdings nicht Dutzende Rohlinge verbrennen, um alle zu testen.
2. Wie gehe ich am Besten mit solch einer Recovery-Distribution vor, um das degraded Raid5-Array (/dev/md2) wieder in Betrieb zu nehmen (bestehend aus /dev/sdb6 und /dev/sdc6)? Welche Arbeitsschritte empfehlen sich da?
Vielen Dank im voraus. Jeder Tipp hilft!
Hardy
Reply to: