[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: raid5, eine Platte mit excessive reads



Am Mittwoch, 26. September 2012 schrieb Matthias Meyer:
> Michael Stummvoll wrote:
> 
> > Hi,
> > 
> > hast du mal SMART drüber laufen lassen? Vlt hat die eine Platte einfach
> > einen Treffer weg.
[…]
> Deutliche Unterschiede sehe ich nur bei "Multi_Zone_Error_Rate":
> /dev/sdc=199, /dev/sdd=113, /dev/sde=2054 und /dev/sdf=8094 und "Raw_Read_Error_Rate":
> /dev/sdc=7, /dev/sdd=202, /dev/sde=578 und /dev/sdf=177

Das mit der Multi Zone Error Rate finde ich schon merkwürdig. Da liegt sdf
doch deutlich höher. Ob dies nun aber die hohe Lesemenge verursacht oder
aber eine Folge davon ist, weiß ich nicht.

> /dev/sdf (die mit den excessiven reads)
> fileserver:~# smartctl -d 3ware,7 -A /dev/twa0
> smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
> Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
> 
> === START OF READ SMART DATA SECTION ===
> SMART Attributes Data Structure revision number: 16
> Vendor Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
>   1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       177
[…]
>   4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       100
[…]
>   5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
>   7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
>   8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
>   9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       15592

Die Platte scheint im Dauerbetrieb zu sein. Für knapp 2 Jahre?

Wie die andere Platte auch.

>  10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
>  11 Calibration_Retry_Count 0x0032   252   252   000    Old_age   Always       -       0
>  12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       25
> 181 Program_Fail_Cnt_Total  0x0022   088   088   000    Old_age   Always       -       280184753

Hmmm, das ist auch sehr hoch. Da es vom Threshold aber unbedenklich und
bei der anderen Platte auch sehr hoch ist, gehe ich mal davon aus, dass
so passt.

> 191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       4
> 192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
> 194 Temperature_Celsius     0x0002   064   064   000    Old_age   Always       -       31 (Lifetime Min/Max 19/35)
> 195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
> 196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
> 197 Current_Pending_Sector  0x0032   252   252   000    Old_age   Always       -       0
> 198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
> 199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
> 200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       8094

Wie gesagt, den Wert finde ich auffällig. Bin kein Experte, was die
Bedeutung der Werte angeht. Da hier aber Old_age steht, könnte es sein,
dass der Wert einfach höher ist, weil die Platte mehr liest als die
anderen.

> 223 Load_Retry_Count        0x0032   252   252   000    Old_age   Always       -       0
> 225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       102

So ein Load Cycle Count hat schon Seltenheitswert. Insbesondere bei einer
Platte, die, wenn ich es richtig verstehe, von 2 Jahre im Betrieb ist. Na,
scheint also ein Server zu sein, der immer läuft ;).

-- 
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA  B82F 991B EAAC A599 84C7


Reply to: