[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Systemverhalten nach Plattenausfall



Paul Muster wrote:

>> Ich würde ein
>>
>> while sleep 1 ; do sync ; done
>>
>> absetzen.
> 
> Hmm, da passiert nicht viel. Wahrscheinlich mag sync nicht auf die
> kaputte IDE-Platte syncen und bleibt deshalb stehen.

Oh - da sieht man auch nicht viel. Hier die Version, die ein wenig was
für das Auge liefert:

while sleep 1 ; do echo "Syncing" ; sync ; done

Das soll nur bewirken, dass alles das was nun noch im Cache liegen
sollte, auch wirklich geschrieben wird. Im Sekundentakt bitteschön.

>> Anschließend in einer zweiten Shell einen smartctl nach dem
>> anderen killen oder warten, bis die Dinger von selber sterben.
> 
> Ja, die wollen aber nicht gekillt werden...

Ich weiß ... :-)

Ich war vor zwei Wochen nur ungeduldig und habe dann auf den Reset-Knopf
gehauen. Mit bekanntem Resultat. ReissWolfFS - Noch Fragen?


> Ich glaube nicht, dass smartctl die Dateisysteme kaputtmacht. Es bleibt
> eher hängen, *weil* die Platte(n) den Geist aufgibt/-geben.

Ich glaube noch nicht, dass die Platte den Weg allen Irdischen geht.

Dem DriveError fehlt noch ein CRC oder ein SektorNotFound oder sowas.

S.a.h.:

http://www.captain.at/howto-linux-driveready-seekcomplete-error-drivestatuserror.php


Und wenn du die Chance hast ein smartctl -a /dev/hd<DEINE_HARDDISK>
abzusetzen - schau doch mal auf die reallocated_sector_count Zahlen.
Wenn die == 0 sind besteht erst mal kaum ein Grund zur Sorge.



>> Sind zufällig die WD Raid-Edition in der Kiste verbaut?
> Nein, die tote war eine Maxtor, die SCSI laufen einwandfrei.

Luschdig - eine Gemeinsamkeit besteht: Bei mir war das am Freitag, den
29.07.2007 um 14:25 Uhr als ich bei einem meiner Server die Meldung von
der /dev/hda bekam. Bei Dir ebenfalls der Freitag. Was für ein Murphy!

Jul 27 14:25:06 192.168.186.199 kernel: hda: drive_cmd: status=0x51 {
DriveReady SeekComplete Error }
Jul 27 14:25:06 192.168.186.199 kernel: hda: drive_cmd: error=0x04 {
DriveStatusError }
Jul 27 14:25:06 192.168.186.199 kernel: ide: failed opcode was: 0xb0


Am Abend vorher hatte ich den Munin eingeschaltet.

smartctl -a /dev/hda

meldet natürlich nix von alledem, was gemeinhin als böse(tm) bekannt
ist. Die Platten sind auch erst ein Jahr alt. Die dürfen erst nach drei
Jahren und einem Tag kaputt gehen. ;-)


t++



Reply to: