[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [testing] reboot brutal



Le Wed, 27 Jun 2012 23:44:01 +0200
Bzzz <lazyvirus@gmx.com> a écrit:

> On Wed, 27 Jun 2012 23:19:21 +0200
> Gaëtan PERRIER <gaetan.perrier@neuf.fr> wrote:
> 
> > 
> > Non une seule fois. Je essaierai de lancer le test toute la
> > journée demain.
> 
> N'exagérons rien, 3-4x d'affilée ça le fait.

Oui mais comme je ne vais pas spécialement revenir chez moi pour éteindre la
machine je pense qu'elle en aura fait beaucoup plus quand je reviendrai demain
soir. ;)

>  
> > > 
> > > Sinon, commence par vérifier que l'enfichage des cartes
> > > addons et de tous les câbles sur la CM est correct.
> > 
> > Tout est ok.
> 
> Donc tu as arrêté la machine, vérifié élément par élément et
> redémarré...

Oui j'ai ouvert la machine vérifié les connections, enlevé et remis les
barrettes de RAM. Tout est ok.

> 
> > > 
> > > Après, reste the usual suspects: les chimiques qui ont gonflé
> > > (stop immédiat),
> > 
> > Elle n'est pas non plus super vieille ma carte (fin octobre 2011).
> > Et l'alim est de la même date (Antec HCG400).
> 
> Rien à voir: si l'électrolyte s'est oxydé ou qu'il n'y-en pas eu
> assez ou qu'il-y-a une prise d'air ou que l'isolant se dégrade ça
> suffit pour nicker les chimiques à vitesse-V.
> Et puis l'électronique c'est comme ça: soit ça pète dans les
> premiers 6 mois, soit ça tient des années, soit ça pète n'importe
> quand.
> 

Oui je sais bien mais bon quand même ...

> > > la CM qui déménage 
> > 
> > oui peut-être mais pas facile à déterminer :(
> 
> Seuls des tests poussés peuvent le dire; mais déjà l'observer à la
> loupe sous une lumière bien crûe ça peut permettre de repérer un truc
> anormal.

Bon ça on verra ce week-end, parce que là je n'ai pas le courage de tout
démonter ;)

> 
> > > et le CPU qui a surchauffé et s'est
> > 
> > Je n'ai pas l'impression dans les logs je ne vois rien qui monte
> > au delà de 50° C et là je suis entre 35 et 40°C selon les cœurs.
> 
> Wai, et puis mnt que les CPUs sont plus ou moins protégés contre ça,
> c'est Trare (par contre, une bonne surtension ou des micro-coupures
> à répétition, ça peut abîmer des tas de choses, mais en Gal ça
> commence par les HDz).
> 
> Pour tester l'ensemble, tu peux tjrs essayer de mettre tout ça en
> burn in pendant 4-5H (me rappelle plus le nom du package de stress).

C'est une idée mais ça ne semble pas lié à la charge parce quand c'est arrivé
je ne faisais vraiment pas grand chose ...

> 
> Mnt, ça peut aussi être dû à un PB dans le kernel ou dans une lib de
> bas niveau, ça ne serait pas la première fois ni la dernière; donc
> avant de tout jeter attend un peu, et en attendant chronomètre donc
> le temps avant crash, histoire de voir s'il est linéaire ou pas.

Je n'aurai pas eu au moins un message, surtout si c'était kernel, non ?
Ça semble purement aléatoire. Le premier est intervenu 30 minutes après le
démarrage (j'avais fais les mises à jours de ce jour), le suivant pendant le
reboot (après la correction des systèmes de fichiers) et le 3e, 1 minute après
le redémarrage ...

Gaëtan


Reply to: