[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Systemverhalten nach Plattenausfall



Thomas Antepoth wrote:
Paul Muster wrote:

/etc/init.d/munin-node stop

Jepp, danke. Das war erstmal dieser Punkt.

Was tun?

Keinesfalls jetzt einen Reset machen. Bei mir war das dann ein
lost+found mit 355 MB Größe gefolgt von einer Neuinstallation.

Nee, hab ich nicht vor. Die Kiste steht 2,5 Autostunden entfernt.

Ich würde ein

while sleep 1 ; do sync ; done

absetzen.

Hmm, da passiert nicht viel. Wahrscheinlich mag sync nicht auf die kaputte IDE-Platte syncen und bleibt deshalb stehen.

Anschließend in einer zweiten Shell einen smartctl nach dem
anderen killen oder warten, bis die Dinger von selber sterben.

Ja, die wollen aber nicht gekillt werden...

top zeigt mir einen Zombie, das ist Bacula:

| root 5755 0.4 0.0 0 0 ? Zsl Aug06 24:07 [bacula-fd] <defunct>

Kann es sein, dass darum die smartctl sich nicht beenden (lassen)?

Wenn es noch geht - ein Backup mittels rsync ist vielleicht jetzt auch
keine schlechte Idee. Wie gesagt - hier bei mir war es ebenfalls ein
zerfrästes Dateisystem nach einem Reset.

Der letzte Backup ist 24h alt, das wäre verkraftbar. Und die SCSI-Platten im RAID, wo das System drauf läuft, sind ja auch weiterhin ok.

Warum allerdings ein häufiger Aufruf von smartctl die einen oder anderen
Platten in einen inkonsistenten Zustand treibt, ist mir auch ein Rätsel.

Ich glaube nicht, dass smartctl die Dateisysteme kaputtmacht. Es bleibt eher hängen, *weil* die Platte(n) den Geist aufgibt/-geben.

Sind zufällig die WD Raid-Edition in der Kiste verbaut?

Nein, die tote war eine Maxtor, die SCSI laufen einwandfrei.


Danke für die schnelle Hilfe & viele Grüße

Paul



Reply to: