[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Problème Raid 1 , DD, autre ?



Le dimanche 28 octobre 2007 09:39, Jean-Yves F. Barbier a écrit :
> Steve a écrit :
> > Bonjour,
>
> .........
>
> > Il n'utilise que le premier DD. J'ai essayé d'ajouter le second, mais
> > régulièrement je me fais jeter après le 2e ou 3e md (ça varie)... ça
> > marchait parfaitement avant (avant quoi...?).
> >
> > Les logs ne montraient rien de particulier (montraient car ça a changé
> > depuis) :
> >
> > Oct 28 08:53:27 opossum kernel: hdb: drive_cmd: status=0x51 { DriveReady
> > SeekComplete Error }
> > Oct 28 08:53:27 opossum kernel: hdb: drive_cmd: error=0x10 {
> > SectorIdNotFound }, LBAsect=12734209, sector=0
> > Oct 28 08:53:27 opossum kernel: ide: failed opcode was: 0xb0
>
> le disque 1 des raid-arrays est en train de claquer

amen, il est mort ;-)

Quelques minutes après avoir envoyé mon courriel, j'ai voulu redémarrer la 
machine, et les deux DD n'étaient plus reconnu par le BIOS. J'ai enlevé hdb 
et le tout est reparti comme en l'an 40.

>
> > Manifestement le 2e DD présente des problèmes. J'ai donc effectué
> > quelques tests avec smartmontools qui montrent effectivement pleins
> > d'erreurs (on en est à 278).
> >
> > Après avoir sauvegardé mes données sur DVD, j'ai téléchargé le Ultimate
> > Boot CD qui permet de tester les DD avec les outils appropriés sans
> > risquer de toucher aux données.
> >
> > Et là, surprise, tant le test court que le long ne montrent *aucune*
> > erreur ! Après avoir redémarré la machine j'obtiens les erreurs
> > ci-dessus. Comment un outil "dédié" peut-il se tromper à ce point par
> > rapport au noyau linux (pas de troll hein!) ?
>
> vi, mais qu'as-tu vérifié? (les md ou les hd ?)

hd

>
> > J'en suis donc là, avec une machine qui refusait parfois de démarrer
> > quand elle était chez son propriétaire mais pas chez moi. Je me demande
> > au passage si ce ne sont pas les conditions particulières chez lui
> > (froid, humidité) qui seraient la source de ce problème.
>
> plutôt des micro-coupures: vu qu'un hd n'a que 3400~4000 cycles on/off
> devant lui, chaque micro-coupure diminue son capital vie (PB vu chez moi et
> chez un archi installé à la campagne: il avait pèté un hd de chaque
> marque!, après "interrogatoire" il s'avérait que ses ampoules d'éclairage
> avaient souvent des fluctuations d'intensité <=> onduleur => PB
> définitivement règlé.)

ça cadre parfaitement avec la situation du proprio de la machine : pêcherie 
avec système électrique défaillant ..  

> par ailleurs, mon expérience demontre que ce type de PB arrive plus
> fréquemment avec des hdz de marque seagate (j'en ai un qui ne fait plus ce
> type de PB, mais qui met 4J (!) à formatter avec un 'mke2fs -c -c')

là c'est un IBM datant de 2003

> > Toute piste est la bienvenue.
>
> ben c'est plutôt une piste noire :(
> tu peux essayer un:
> mke2fs -c -c -m0 -v /dev/partitionkiplantesurhdkimarchpô
> puis essayer de réintégrer les partitions dans les md.
>
> ca a peu de chance de fonctionner, par ce que le md considère que si une
> erreur intervient sur un seul des disques, alors il faut faire un kick out
> de ce hd.
>
> Donc, la solution la plus rapide consisterait à faire un (possible, puisque
> tu as sauvegardé tes données):
> mke2fs -c -c -m0 -v /dev/mdX
> ce qui marqueras les secteurs défectueux *pour les 2 hdz de l'array*
>
> Enfin, la solution raisonnable et rapide (mais pas bon marché) serait de
> directement changer le hd incriminé, en veillant bien, si CHS est différent
> de l'original, à ce que ses partitions soient strictement égales ou
> supérieures en taille;

c'est que je vais faire.

> de façon à ce que son ajout ne soit pas rejeté par 
> mdadm.  Puis laisser faire la syncho pour que les 2 HDz soient identiques,
> puis restaurer tes données.

La question est maintenant de savoir si je peux acheter un dd sata vu qu'il y 
a 2 connecteurs et de faire un raid1 avec hda et sda ? et ensuite de passer à 
2 sata sda et sdb. Une idée ?

> > Excellent dimanche.
>
> ça risque d'être un dimanche chargé pour toi ;-)

Et en plus il y a une heure de plus ;-)

> JY

Merci et merci aussi à Hugues pour sa réponse (à laquelle je ne répondrai pas, 
qu'il m'excuse, pour des raisons évidentes ;-))

-- 
steve



Reply to: