Re: a propos de "lost+found", SMART, stabilite de file system
d'abord merci à basile@starynkevitch.net pour l'info, même si
avec smartctl je n'obtiens aucun signe d'erreur !
à part quelques UDMA_CRC_Error_Count qui n'ont pas l'air d'alerter
smartctl
de plus, "badblocks -s /dev/hdb" ne montre rien ...
par contre, c'est vrai qu'en cherchant dans les log :
grep hdb /var/log/kern.log /var/log/messages /var/log/syslog | grep error
j'ai beaucoup d'erreurs.
aussi, j'ai bien dans la config du kernel
CONFIG_IDEDISK_MULTI_MODE=y
enfin
en farfouillant dans les log + google , l'origine serait dans la RAM :
/var/log/kern.log:May 5 02:35:56 copix kernel: Filesystem "ide0(3,73)":
Corruption of in-memory data detected. Shutting down filesystem:
ide0(3,73)
je ne sais pas si cela concerne une partition ext3 ou xfs
[ google donne plein de mail sur xfs et "Corruption of in-memory data
detected" ]
et puis
mais memtest86 n'a toujours pas vu d'erreur avec la memoire...
Je commence a avoir des doutes sur sarge et le kernel 2.4.27-8,
et alors un changement de disque ne m'avancerait a rien...
de plus, j'ai eu un probleme avec une partition ext3, et aussi avec une
xfs.
Une suggestion ???
- gilles missonnier -
ceussent que cela interessent peuvent voir des extraits de log ci dessous.
=====================================================
extrait de la commande : smartctl -a /dev/hdb
...
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 060 Pre-fail Always
- 1
2 Throughput_Performance 0x0005 100 100 050 Pre-fail Offline
- 0
3 Spin_Up_Time 0x0007 100 100 024 Pre-fail Always
- 163 (Average 166)
4 Start_Stop_Count 0x0012 100 100 000 Old_age Always
- 1680
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always
- 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always
- 0
8 Seek_Time_Performance 0x0005 100 100 020 Pre-fail Offline
- 0
9 Power_On_Hours 0x0012 100 100 000 Old_age Always
- 5601
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always
- 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always
- 629
192 Power-Off_Retract_Count 0x0032 099 099 050 Old_age Always
- 1824
193 Load_Cycle_Count 0x0012 099 099 050 Old_age Always
- 1824
194 Temperature_Celsius 0x0002 144 144 000 Old_age Always
- 38 (Lifetime Min/Max 17/58)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always
- 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always
- 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline
- 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always
- 57
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours)LBA_of_first_error
# 1 Extended offline Completed without error 00% 5600 -
# 2 Extended offline Completed without error 00% 5592 -
# 3 Short offline Completed without error 00% 5591 -
# 4 Extended offline Completed without error 00% 4706 -
# 5 Short offline Completed without error 00% 4706
-
===================================================================
extraits du résultat de la commande :
grep hdb /var/log/kern.log /var/log/messages /var/log/syslog | grep error
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: recal_intr:
error=0x00 { }
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: set_multmode:
error=0x00 { }
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: recal_intr:
error=0x00 { }
/var/log/kern.log:May 10 14:07:57 copix kernel: hdb: set_geometry_intr:
error=0x37 { DriveStatusError SectorIdNotFound TrackZeroNotFound
AddrMarkNotFound }, LBAsect=255304785, sector=7728
/var/log/syslog:May 11 20:10:24 copix kernel: hdb: set_geometry_intr:
error=0x37 { DriveStatusError SectorIdNotFound TrackZeroNotFound
AddrMarkNotFound }, LBAsect=255304785, sector=21352
/var/log/syslog:May 11 20:10:24 copix kernel: end_request: I/O error, dev
03:47 (hdb), sector 21352
/var/log/syslog:May 11 20:10:24 copix kernel: hdb: recal_intr: error=0x00
{ }
/var/log/syslog:May 11 21:16:29 copix kernel: hdb: status error:
status=0x51 { DriveReady SeekComplete Error }
/var/log/syslog:May 11 21:16:29 copix kernel: hdb: status error:
error=0x04 { DriveStatusError }
/var/log/messages:May 12 14:59:58 copix kernel: hdb: dma_intr: error=0x84
{ DriveStatusError BadCRC }
/var/log/syslog:May 12 16:28:34 copix kernel: hdb: status error:
status=0x58 { DriveReady SeekComplete DataRequest }
/var/log/messages:May 9 14:30:12 copix kernel: hdb: dma_intr: error=0xb6
{ DriveStatusError BadCRC SectorIdNotFound TrackZeroNotFound },
LBAsect=11933521, sector=13288
====================================================================
->> => peut-on installer un mode simplifie de smartmontools sans bonobo ?
->> et comment ?
->
->On peut utiliser la commande /usr/sbin/smartctl dans un terminal (sous
->root).
->
->Oui, surtout si vous avez des messages d'erreur (genre ide ou hda)
->dans vos logs (/var/log/message, /var/log/syslog, /var/log/kern.log,
->dmesg) et/ou si smartctl vous l'indique. Sauvegardez vite vos données
->importantes et achetez un autre disque!
->
->A mon avis le plus urgent est de sauvegarder (par le réseau et/ou sur
->CD) vos données importantes... Votre disque est probablement mourant
->(et une sauvegarde ne fait jamais de mal).
Reply to: