Re: kaputte HD?

To: debian-user-german@lists.debian.org
Subject: Re: kaputte HD?
From: Martin Steigerwald <Martin@lichtvoll.de>
Date: Fri, 10 Jun 2011 19:29:04 +0200
Message-id: <[🔎] 201106101929.04973.Martin@lichtvoll.de>
In-reply-to: <[🔎] 20110610114835.67d508ad@debian.debian.site>
References: <[🔎] 20110610114835.67d508ad@debian.debian.site> (sfid-20110610_165550_794630_EFF76D20)

Am Freitag, 10. Juni 2011 schrieb Gregor Wende:
> Hallo zusammen,

Hallo Gregor,

> scheinbar macht sich eine Festplatte auf den Weg ins Nirvana.
> Zumindest meldet die Laufwerksverwaltung fehlerhafte Sektoren und seit
> gestern oder vorgestern auch ausstehende Sektoren.
> Ich erinnerte mich an dieses Posting:
> 
> http://lists.debian.org/debian-user-german/2011/05/msg00352.html
> 
> > Ich würd Folgendes probieren:
> > 
> > - *Erstmal Backup!*
> > 
> > Dann:
> > 
> > - smartctl -a <Laufwerk> > vor-langem-selbsttest.log
> > 
> > - smartctl -t long <Laufwerk>
> > 
> > - Warten bis der Test durchgelaufen ist, kann einige Stunden dauern
> > 
> > - smartctl -a <Laufwerk> > nach-langsam-selbsttest.log
> > 
> > Wenn da keine Medienfehler auftreten:
> > 
> > - die Dateisysteme prüfen und ggf. reparieren
> 
> Backup läuft eh ständig, den ersten Test hab ich gemacht und der lange
> Test läuft gerade.
> 
> Hier mal das Log vom ersten Test, was mir mal irgendwie so gar nix
> sagt. Kann mir da evtl. mal jemand was zu sagen?
> 
> > smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local
> > build)
> 
> Copyright (C) 2002-10 by Bruce Allen,
> http://smartmontools.sourceforge.net
> 
> > === START OF INFORMATION SECTION ===
> > Model Family:     Seagate Barracuda 7200.10 family
> > Device Model:     ST3320820AS
> > Serial Number:    5QF1SBC4
> > Firmware Version: 3.AAC
> > User Capacity:    320.072.933.376 bytes
> > Device is:        In smartctl database [for details use: -P show]
> > ATA Version is:   7
> > ATA Standard is:  Exact ATA specification draft version not indicated
> > Local Time is:    Fri Jun 10 11:07:34 2011 CEST
> > SMART support is: Available - device has SMART capability.
> > SMART support is: Enabled
> > 
> > === START OF READ SMART DATA SECTION ===
> > SMART overall-health self-assessment test result: PASSED

Die Platte denkt, sie sei noch okay. Das muss aber nicht allzuviel heißen.

> Short self-test routine
> 
> > recommended polling time: 	 (   1) minutes.
> > Extended self-test routine
> > recommended polling time: 	 ( 115) minutes.
> > 
> > SMART Attributes Data Structure revision number: 10
> > Vendor Specific SMART Attributes with Thresholds:
> > ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE
> > UPDATED  WHEN_FAILED RAW_VALUE
> 
>   1 Raw_Read_Error_Rate     0x000f   117   091   006    Pre-fail
> Always       -       167699590

Die Tabelle ist in der Mail arg doof zu lesen. Pack die bitte mal als 
Textanhang bei oder auf http://paste.debian.net/

Am besten mal die ganze Ausgabe von smartctl -a. An die Mail ggf. gezippt, 
damit der Anhang nicht zu groß ist.

> > SMART Error Log Version: 1
> > 
> >> ATA Error Count: 646 (device log contains only the most recent five
> >> errors)
> >	
> >	CR = Command Register [HEX]
> >	
> > 	FR = Features Register [HEX]
> > 	SC = Sector Count Register [HEX]
> > 	SN = Sector Number Register [HEX]
> > 	CL = Cylinder Low Register [HEX]
> > 	CH = Cylinder High Register [HEX]
> > 	DH = Device/Head Register [HEX]
> > 	DC = Device Command Register [HEX]
> > 	ER = Error register [HEX]
> > 	ST = Status register [HEX]
> > 
> > Powered_Up_Time is measured from power on, and printed as
> > DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
> > SS=sec, and sss=millisec. It "wraps" after 49.710 days.
> > 
> > Error 646 occurred at disk power-on lifetime: 6118 hours (254 days +
> > 22 hours)
> > 
> >  When the command that caused the error occurred, the device was
> >
> >active or idle.
> >
> >   After command completion occurred, registers were:
> >   ER ST SC SN CL CH DH
> >   -- -- -- -- -- -- --
> >   40 51 00 9a fe 48 e0  Error: UNC at LBA = 0x0048fe9a = 4783770
> >   
> >   Commands leading to the command that caused the error were:
> >   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
> >   -- -- -- -- -- -- -- --  ----------------  --------------------
> >   25 00 68 87 fe 48 e0 00      00:11:28.061  READ DMA EXT
> >   35 00 08 17 da 64 e0 00      00:11:28.061  WRITE DMA EXT
> >   35 00 08 77 1b 60 e0 00      00:11:28.061  WRITE DMA EXT
> >   35 00 30 07 43 5f e0 00      00:11:26.076  WRITE DMA EXT
> >   25 00 01 00 00 00 e0 00      00:11:26.076  READ DMA EXT
> > 
> > Error 645 occurred at disk power-on lifetime: 6118 hours (254 days +
> > 22 hours)

UNC steht für Uncorrectable Error, LBA bezeichnet dann einen den Block, wo 
das passierte (Logical Block Adressing, also nicht mehr 
Zylinder/Kopf/Sektor).

Also wenn das jetzt vor kurzem passiert ist und beim langen Test noch 
weitere Fehler auftreten, würde ich die Platte tauschen.

Interessant ist auch, was der Kernel in dmesg / kern.log / syslog so von 
sich gibt.

Ciao,
-- 
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA  B82F 991B EAAC A599 84C7

Attachment: signature.asc
Description: This is a digitally signed message part.

Reply to:

Follow-Ups:
- Re: kaputte HD?
  - From: Gregor Wende <g.wende@paranid.com>

References:
- kaputte HD?
  - From: Gregor Wende <g.wende@paranid.com>

Prev by Date: Re: Update Frage nvidia-glx-legacy-96xx
Next by Date: Re: squeeze und kernel 2.6.38
Previous by thread: kaputte HD?
Next by thread: Re: kaputte HD?
Index(es):
- Date
- Thread