[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Software-RAID: Platten fliegen immer wieder aus dem RAID



Mahlzeit,

Meinhard Schneider schrieb am Mittwoch, den 23.06.2010 um 12:39:
> On Wed, Jun 23, 2010 at 11:01:18AM +0200, Peter Funk wrote:
> > > Seit dem ich den Server für Wartungsarbeiten herunter gefahren habe, fliegt
> > > immer wieder das RAID auseinander. Der Fehler liegt immer mal auf einer
> > > anderen Platte, aber immer der gleiche Sektor. SMART sagt, dass die Platten
> > > in bester
> > 
> > Es sollte geprüft werden, ob es diesen Sektor überhaupt gibt. Hier geht es um
> > den Sektor 35841920 also muß das Gerät mindestens 17.09075927734375 GB groß
> > sein. Ist das der Fall? Wenn nein, dann mal einen Dateisystem-Check
> > durchführen.
> [...]
> fdisk sagt:
> Platte /dev/sdd: 18.3 GByte, 18351959040 Byte

Okay: Das konnte ich ja nicht wissen. Wie sieht es denn mit der
Größte der Partition aus?  Manchmal wird die Partition auf volle
Zylinder gerundet und der Sektor 35841920 liegt dann womöglich
hinter dem Ende der Partitionen /dev/sdd3 bzw. /dev/sde3.  Das ist
ja ziemlich knapp hier.

> 64 Köpfe, 32 Sektoren/Spuren, 17501 Zylinder
> Einheiten = Zylinder von 2048 × 512 = 1048576 Bytes
> (identische Ausgabe für sde)
> 
> Die Platten sollten also groß genug sein, sprich den Sektor 35841920 gibt's
> wirklich.
> 
> Was ich nicht verstehe ist der Vorschlag mit dem fsck - was hat der damit zu
> tun? Das Problem liegt doch weiter unten in der Hierarchie.

Ich würde das ja nicht schreiben, wenn ich das nicht so ähnlich mit
einem ReiserFS selbst erlebt hätte.  Damals hatte mir ein reiserfsck
--rebuildtree (oder so ähnlich) Abhilfe gebracht.

In einem anderen Fall hatte ich auch schon mal das Problem, dass ich 
eine Platte als Ersatzteil hatte, die ausgerechnet nur einen Zylinder
kleiner war.  (Es war zwar die gleiche kaufmännische Kapazität angegeben,
aber... man kann es sich vorstellen).

Der Sektor-Zugriff auf das Metadisk-Device (/dev/mdX) wird von der
RAID-Ebene direkt an eine der Platte durchgereicht.  Die meldet dann
einen IO-Error, wenn versucht wird, auf einen Sektor zuzugreifen,
den es gar nicht gibt.  Die RAID-Ebene wirft das dabei zugrgiffene
benutzte Gerät dann als "Faulty" aus dem Verbund heraus.  Bei RAID1
ist das zufällig immer die eine oder die andere Platte.  Das Problem
tritt immer dann auf, wenn von weiter oben in der Hierarchie ein Sektor
angefordert wird, den es gar nicht gibt.  Deshalb meine Vermutung, dass
sich in die Metadaten des Dateisystemes eine ungültige Sektor-Adresse
eingeschlichen hat.  Diese könnte dann vielleicht durch einen
rigorosen fsck beseitigt werden.  Verdächtig ist natürlich, dass
die Sektor-Adresse zufällig sehr nahe am Ende der oben errechneten
Kapazität liegt.  Das macht mich nachdenklich.

Gruß, Peter
-- 
Peter Funk, ✉Oldenburger Str.86, D-27777 Ganderkesee
office: ArtCom GmbH, ✉Haferwende 2, D-28357 Bremen, Germany 
tel:+49-421-20419-0 cell:+49-179-640-8878 <http://www.artcom-gmbh.de/>


Reply to: