[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Degraded RAID5-Array nach HDD-Ausfall wieder in Betrieb nehmen



Hallo Liste,

ich suche Rat für eine Datenrettungsaktion. Jeder Vorschlag wird gern genommen.

Folgende Ausgangssituation:

- FileServer mit Debian Etch Samba Server Installation ohne Desktop.
- Ein Sockel 939 Board mit 4x SATA (Foxconn 6150BK8MC)
- 3x Samsung 320 GB T166 HD321KJ an den internen Anschlüssen
- Software-RAID

Folgende Filesystemaufteilung:
/boot   ext3   raid1   sda1,sdb1,sdc1(spare)   /dev/md0
swap   swap   sda2,sdb2,sdc2
/   ext3   raid5   sda5,sdb5,sdc5   /dev/md1
/home   xfs   raid5   sda6,sdb6,sdc6   /dev/md2

Ich habe gestern abend festgestellt, dass sda nicht mehr in den raid5-Arrays enthalten war. Die Arrays md1 und md2 waren clean, aber degraded.
Reboots klappten zu diesem Zeitpunkt noch. Die Daten waren verfügbar.

Ich dachte, ich könnte das Problem lösen, indem ich für die Partition hda5 ein re-add mache und somit wieder das Raid zum Laufen bekomme, also mdadm /dev/md1 --re-add /dev/sda5.

Das war ein Riesenfehler. Nach dieser Aktion kam ich beim Reboot nur noch in eine Hilfs-Shell, da das Array /dev/md1 nicht mehr gestartet werden konnte.
Den Ausgaben des Kernels nach, scheint jedoch /dev/md2 gestartet zu werden. Ich komme jedoch vom Etch-System nicht mehr heran, da ich ja kein / mehr habe.

Ich habe dann versucht mit Knoppix 5.2 zu  booten und zu schauen, ob Knoppix ggf. /dev/md2 wieder in Betrieb nimmt - vielleicht eine Scan-Routine zum Boot-Zeitpunkt oder ähnliches.
Dies hat Knoppix leider nicht getan und da ich aber für's erste geheilt war, habe ich von weiteren Experimenten der Reparatur abgesehen.

Das System bootet mittlerweile gar nicht mehr von Platte. Ich vermute, dass Grub nur auf sda installiert war und Grub nun auch nicht mehr geladen werden kann.

Die /home Partition enthält jedoch eine Menge Daten, die ich nicht verlieren möchte. Deshalb die Fragen.

1. Gibt es eine empfehlenswerte Recovery-Distri, ggf. basierend auf Debian, die sich besonders zur Rettung von Daten eignet? Distrowatch nennt so einige Distributionen. Ich möchte allerdings nicht Dutzende Rohlinge verbrennen, um alle zu testen.

2. Wie gehe ich am Besten mit solch einer Recovery-Distribution vor, um das degraded Raid5-Array (/dev/md2) wieder in Betrieb zu nehmen (bestehend aus /dev/sdb6 und /dev/sdc6)? Welche Arbeitsschritte empfehlen sich da?


Vielen Dank im voraus. Jeder Tipp hilft!
Hardy


Reply to: