[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

smartmontools : 2 Currently unreadable (pending) sectors & 2 Offline uncorrectable sectors



Bonsoir,

Depuis quelques heures, je reçois des alertes smart pour une de mes
disques, et j'aimerais savoir que faire.
J'ai brièvement regardé des documentations, mais sa par un peu dans tout
les sens avec des calculs de secteur, modifications de LVM ...

Pour le moment le seul lien qui corresponde à quelque chose de cohérent
que j'ai trouver est :
http://smartmontools.sourceforge.net/badblockhowto.html#lvm
Mais j'avoue que c'est encore assez obscure pour moi, alors avant de me
lancer dedans, je voulais vos avis et conseils

Voici les messages des mails de smartmontools:

The following warning/error was logged by the smartd daemon:

Device: /dev/hda, 2 Offline uncorrectable sectors

For details see host's SYSLOG (default: /var/log/syslog).
------------------------------------------------------------
The following warning/error was logged by the smartd daemon:

Device: /dev/hda, 2 Currently unreadable (pending) sectors

For details see host's SYSLOG (default: /var/log/syslog).


Et dans mon syslog j'ai :

Aug 10 20:21:43 angelina smartd[3579]: Device: /dev/hda, 2 Currently unreadable (pending) sectors
Aug 10 20:21:43 angelina smartd[3579]: Device: /dev/hda, 2 Offline uncorrectable sectors


Rien de plus

Après un test court j'ai :
smartctl -l selftest /dev/hda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining 
LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       20%     
8330         1371132601

Le sg_verify:
# sg_verify --lba=1371132601 /dev/hda
verify (10): pass through os error: Invalid argument
Verify(10) failed near lba=1371132601 [0x51b9d2b9]

Visiblement pas d'invocation correcte de la commande, mais le man ne
m'aide pas a faire mieux...

Le test long est en cours d'exécution, bien que je pense qu'il en
sortira exactement la même chose...

Par contre, j'avais cru comprendre que les disques détectaient
automatiquement leurs secteur défectueux et switchais sur des secteurs
de secours dans ces cas la automatiquement et de manière transparente
pour l'OS.

Pour ce qui est de mes données, elles sont dans une lvm au dessus d'un
raid5 (device mapper) de 4 disque (sans disque de secours)

Pourriez vous me dire ce qu'il vous faudrait comme informations
supplémentaire, ce que représente exactement ces erreurs (pour mon
disque, pour mes données), et ce que je dois faire pour remédié à ces
problèmes (contrôles à effectuer, le niveaux où intervenir le plus
efficacement) svp ?
Dois-je envisagé sérieusement/rapidement un recours à la garantie ? Des
données (de ces secteurs) doivent elles être restaurées (grace au RAID) ?


Merci d'avance pour votre aide,
Et toutes mes excuses si elles font doublons avec d'autre posts.

Thibaut Chèze

PS:
J'avais trouver sur le net une ligne a mettre dans le /etc/smartd.conf
pour programmer des tests automatiquement, mais le serveur refuse de
démarrer lorsqu'elle est présente
La ligne : DEVICESCAN -a -o on -S on -s (S/../.././05|L/../../6/01) -m
root@localhost -M CheckDisk

Je suis preneur de tout conseils sur comment gérer mes disques durs
également.
Merci


Reply to: