[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Sorgen nach smartctl



Hallo Thorsten,
Am Dienstag, 8. Januar 2008 schrieb Thorsten Strusch:
> Siegfrid Brandstätter schrieb:
> > Hallo,
> > nach dem ich bei mir mal meine beiden Festplatten mit smartctl getestet
> > habe mache ich mir nun Sorgen. Leider kann ich die Error Meldungen nicht
> > deuten. Aber da mir nichts gravierendes an Fehlern auffällt frage ich
> > mich nun ob sich was anbahnen könnte.
>
> ja, siehe nachfolgende Kommentare. hdd bzw. die Verkabelung von hdd
> scheinen nicht i.O. zu sein.
>
> Es gibt vom Hersteller auch ein tool zum Überprüfen - solltest du
> dir herunterladen, auf Diskette packen und laufen lassen.
>
> > dlx:/home/sigi# smartctl -a /dev/hdd
> > === START OF INFORMATION SECTION ===
> > Model Family:     Seagate Barracuda 7200.7 and 7200.7 Plus family
> > Device Model:     ST3160021A
> > User Capacity:    160.041.885.696 bytes
> >
> > === START OF READ SMART DATA SECTION ===
> >
> > SMART Attributes Data Structure revision number: 10
> > Vendor Specific SMART Attributes with Thresholds:
> > ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED
> > WHEN_FAILED RAW_VALUE
> >   1 Raw_Read_Error_Rate     0x000f   056   052   006    Pre-fail
> > Always       -       212966076
> >   7 Seek_Error_Rate         0x000f   082   060   030    Pre-fail
> > Always       -       176727751
> > 195 Hardware_ECC_Recovered  0x001a   056   052   000    Old_age
> > Always       -       212966076
>
> Raw_Read_Error_Rate, Seek_Error_Rate und Hardware_ECC_Recovered
> haben bei dir hohe Werte (212966076, 176727751 und 212966076).
> Was hoch ist und was nicht, kann ich dir nicht sagen, das ist
> Erfahrungssache. Auf jeden Fall ist das nicht i.O.
>
> Sehr sinnvoll ist eine Überwachung z.B. mittels
> munin. Dann siehst du im Grafen, wenn ein zwei Werte 'abhauen'
> und Probleme mit der Platte wahrscheinlich sind.

Munin habe ich mir nun installiert, aber nicht rausgefunden wie ich das 
starte.

>
> Die von dir nun folgenden 81 Fehler (wovon nur die letzten aufgehoben
> werden) deuten auf eine sterbende Platte hin.
> hdd ist sofort zu sichern!
> Tausch auch mal das Kabel aus und lass ein smartctl -t long /dev/hdd
> laufen.
> Der Test muss sich beenden und die Fehlernummer darf sich nicht mehr
> erhöhen. Dann hattest du Glück und nur ein defektes Kabel (habe ich
> schon häufiger gehabt)

Es bleibt bei den 81 Fehlern. Ich hatte die Kabel von den beiden Platten 
getauscht. Bei den Kabeln wundert es ja nicht, die sind ja so was von 
unhandlich, so breit, zu kurz und ergeben dadurch einen Zug am Kabel und in 
der Verbindung. 

> Wenn es wieder Fehler gibt - austauschen!

Das kann ich mir nun hoffentlich ersparen. 
>
> > ##############
> >
> > dlx:/home/sigi# smartctl -a /dev/hda
> > Device Model:     ST340014A
> > User Capacity:    40.020.664.320 bytes
> > SMART support is: Enabled
>
> wenn die Platte Probleme bereiten wird, kauf einfach eine neue.
> Eine 80 GB Platte bekommst du ab ~35 EUR, eine 160er ab 45EUR.
> Bedenke, dass die Produktion von PATA Platten bald auslaufen
> wird...
>
> > === START OF READ SMART DATA SECTION ===
> > SMART overall-health self-assessment test result: PASSED
> >
> > General SMART Values:
> > Offline data collection status:  (0x82) Offline data collection activity
> >                                         was completed without error.
> >                                         Auto Offline Data Collection:
> > Enabled. Self-test execution status:      (   0) The previous self-test
> > routine completed
>
> das ist auch wichtig. Bei defekten Platten steht am Ende des
> smartctl-Laufs hier keine null, weil der Test nicht durchlaufen
> konnte.

Das erhalte ich nun bei beiden HD auch immer. "Self-test execution status:      
(   0)"
>
> > SMART Self-test log structure revision number 1
> > Num  Test_Description    Status                  Remaining 
> > LifeTime(hours) LBA_of_first_error
> > # 1  Extended offline    Completed without error       00%      3895     
> >    -
>
> das ist gut! hda schein i.O. zu sein.

Damit müsste doch wenn es aktuell einen Fehler gäbe, dieser gezeigt werden. 
Oder habe ich das falsch verstanden?
"Listing 2: Abfrage des Gesundheitszustands " mit "smartctl -H /dev/hda"

dlx:/home/sigi# smartctl -H /dev/hda
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

dlx:/home/sigi# smartctl -H /dev/hdd
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED


Ich danke Dir recht Herzlich für Deine Hilfe. Nun kann ich hoffentlich 
beruhigt weiterwerkeln. 

Einen schönen Gruß 
Sigi


Reply to: