[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [testing] reboot brutal



On Thu, 28 Jun 2012 00:22:21 +0200
Gaëtan PERRIER <gaetan.perrier@neuf.fr> wrote:

> > Pour tester l'ensemble, tu peux tjrs essayer de mettre tout ça en
> > burn in pendant 4-5H (me rappelle plus le nom du package de
> > stress).
> 
> C'est une idée mais ça ne semble pas lié à la charge parce quand
> c'est arrivé je ne faisais vraiment pas grand chose ...

Arf, nan: c'est juste pour stresser le matériel; ça permet de voir
si une conjonction d'actions le fait sauter (ça n'est pas parce que
tu ne fais rien qu'il ne se passe rien).
Par contre, évite s'il fait trop chaud: ça arrache qd même. 

> > 
> > Mnt, ça peut aussi être dû à un PB dans le kernel ou dans une
> > lib de bas niveau, ça ne serait pas la première fois ni la
> > dernière; donc avant de tout jeter attend un peu, et en
> > attendant chronomètre donc le temps avant crash, histoire de
> > voir s'il est linéaire ou pas.
> 
> Je n'aurai pas eu au moins un message, surtout si c'était kernel,
> non ?

Pas forcément parce que quand ça le crash, il-y-a certains cas où
les mécanismes de trace etc n'ont pas le temps d'agir; à T0 ça va,
et à T+qq ns tout est arrêté.

> Ça semble purement aléatoire. Le premier est intervenu 30
> minutes après le démarrage (j'avais fais les mises à jours de ce
> jour), le suivant pendant le reboot (après la correction des
> systèmes de fichiers) et le 3e, 1 minute après le redémarrage ...

Ce qui est moins aléatoire, c'est la mise à jour juste avant.
Donc avant tout, essaye de downgrader les packages MàJ.

-- 
The attacker must vanquish; the defender need only survive.


Reply to: