[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: smartd macht mir Sorgen...



Thomas Kreft <daeron@gmx.net> wrote:

> Nun scheint sich herauszustellen, dass nicht Debian Unstable ist, sondern die 
> Festplatte! ;) Seit gestern meldet smartd:

> Hard Disk Health Warning:
>   This message was generated by the smartd daemon running on:
>      host name:  elrond
>      DNS domain: imladris
>   The following warning/error was logged by the smartd daemon:
>   Device: /dev/sda [SAT], 1 Currently unreadable (pending) sectors
>   Device info:
>   WDC WD1001FALS-00J7B1, S/N:WD-WMATV1721603, WWN:5-0014ee-05699dd9e, 
> FW:05.00K05, 1.00 TB
>   For details see host's SYSLOG.
>   You can also use the smartctl utility for further investigation.
>   Another message will be sent in 24 hours if the problem persists.

> Allerdings hat ein anschließender "Extended offline" Test nichts
> gefunden. Ich frage mich nun, wie ernst ich es in diesem Lichte
> betrachtet nehmen muss, dass der Current_Pending_Sector RAW Wert
> weiterhin auf "1" steht. Hat hier jemand Erfahrungen mit der Deutung
> von smartctl?

Ein "pending sector" ist ein Sektor, der nicht mehr gelesen werden kann
aber vermutlich beim nächsten Überschreiben wieder OK ist. Entweder,
weil er wieder funktioniert (kommt sehr oft vor) oder weil die Platte
den Sektor remapped hat. Tritt letzteres ein, so steigt der Counter bei
Reallocated_Sector_Ct.

Ein pendin sector ist noch kein Grund für Roten Alarm, aber dennoch sind
bereits 512 Bytes an Daten verloren gegangen. Ob diese in einem ohnehin
leeren Bereich des Dateisystems lagen oder nicht, dass kann man erst
sehen, wenn man den genauen Sektor kennt.

Ich empfehle hier die Lektüre von
http://smartmontools.sourceforge.net/badblockhowto.html

Leider lieferte der Extendes-Offline-Test keine Ergebnisse, dann hätte
man mittels hdparm den defekten Sektor gezielt überschreiben können.

Wäre die Platte in einem RAID, so könnte man sie jetzt einfach aus dem
Verbund nehmen, wieder einfügen und somit ein komplettes Überschreiben
aller Sektoren auslösen.

Du könntest von einem externen Medium booten und mittels badblocks und
(WICHTIG!) der Option "-n" einmal alle Daten lesen und wieder schreiben
lassen.

Das liefert dir entweder den genauen Sektor, an dem es knallt oder es
frischt die Daten genug auf, dass das Problem verschwindet.

Alternativ kannst du auch versuchen, die Platte mittels "dd if=/dev/sda
of=/dev/null bs=16M" mehrfach auszulesen (das funktioniert auch im
Betrieb), evtl. taucht der Sektor im Kernel-Log auf und du kannst ihn
dann mittels hdparm direkt überschreiben.

S°

-- 
Sigmentation fault. Core dumped.


Reply to: