Re: kann sich jemand erklären warum beide Festplatten auf dem selben Sector einen Fehler haben?
Am 09.05.2013 09:18, schrieb Martin Klaiber:
Ich würde an Deiner Stelle erst mal mit smartctl prüfen, ob es an den
Festplatten liegt oder nicht.
Gruß, Martin
Hallo Martin,
laut einer google Studie hat SMART nur bei 60% Ausfälle der Festplatten
vorhersagen können, das heist aber das 30% unbemerkt sterben. Meine
SMART Werte sind normal. Dies erklärt auch nicht warum 4x der gleiche
Sector auf 4 unterschiedlichen Festplatten welche auf 2 Physischen
Server verbaut sind angeblich defekt ist.
Es ist sehr merkwürdig warum dieser Sector angemerkt wird. Aber ich
denke das ist nur eine Folge vom Fehler davor. Alle Systeme haben aber
etwas gemeinsam Sie sind baugleich (CPU/S-ATA Controler, Festplatten,
BIOS etc) und haben die gleiche Software installiert. An der gleichen
Stelle werden auch wohl die RAID Metadaten liegen und der o.g. Sector
liegt in der 4. Partition entweder befinden sich dort die RAID Metadaten
oder die des ersten LVM.
Meiner Ansicht nach muss es an der Kombination, Kernel. S-ATA Controller
und Festplatte und Software Raid als PV eines VG für LV des LVM...
LVM auf einem SoftwareRaid zu betreiben ist aber auch nichts
ungewöhnliches, dies habe ich auch auf einem anderen Server, auch mit
den gleichen Festplatten Typ und Software Umgebung. Einziger Unterschied
auf der Kiste welche bislang keinen Fehler hatte, sind ein anderes
Mainboard, BIOS und CPU. Selbst der S-ATA Controlerchip ist laut lspci
der gleiche. Was die suche nach dem Ursache nun erschwert.
Anbei die SMART Werte evtl. siehst du etwas was ich übersehen habe.
smartctl -A /dev/sdb
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0027 253 227 021 Pre-fail
Always - 1408
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 240
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail
Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age
Always - 0
9 Power_On_Hours 0x0032 067 067 000 Old_age
Always - 24331
10 Spin_Retry_Count 0x0032 100 100 000 Old_age
Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 239
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age
Always - 172
193 Load_Cycle_Count 0x0032 200 200 000 Old_age
Always - 240
194 Temperature_Celsius 0x0022 118 099 000 Old_age
Always - 32
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age
Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age
Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age
Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age
Offline - 0
240 Head_Flying_Hours 0x0032 069 069 000 Old_age
Always - 22991
241 Total_LBAs_Written 0x0032 200 200 000 Old_age
Always - 116331190862
242 Total_LBAs_Read 0x0032 200 200 000 Old_age
Always - 87799870921
smartctl -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0027 253 253 021 Pre-fail
Always - 1100
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 16
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail
Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age
Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age
Always - 134
10 Spin_Retry_Count 0x0032 100 253 000 Old_age
Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 15
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age
Always - 13
193 Load_Cycle_Count 0x0032 200 200 000 Old_age
Always - 2
194 Temperature_Celsius 0x0022 115 101 000 Old_age
Always - 35
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age
Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age
Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age
Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age
Offline - 0
smartctl -A /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0027 253 253 021 Pre-fail
Always - 1075
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 6
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail
Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age
Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age
Always - 130
10 Spin_Retry_Count 0x0032 100 253 000 Old_age
Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 5
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age
Always - 4
193 Load_Cycle_Count 0x0032 200 200 000 Old_age
Always - 1
194 Temperature_Celsius 0x0022 117 106 000 Old_age
Always - 33
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age
Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age
Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age
Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age
Offline - 0
smartctl -A /dev/sdb
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0027 253 253 021 Pre-fail
Always - 1166
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 15
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail
Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age
Always - 1
9 Power_On_Hours 0x0032 100 100 000 Old_age
Always - 134
10 Spin_Retry_Count 0x0032 100 253 000 Old_age
Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 14
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age
Always - 12
193 Load_Cycle_Count 0x0032 200 200 000 Old_age
Always - 2
194 Temperature_Celsius 0x0022 112 106 000 Old_age
Always - 38
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age
Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age
Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age
Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age
Offline - 0
Reply to: