[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Hangcheck timer



On 12 Oct 2010, at 20:43, fredrik@kyla.kiruna.se wrote:
> Jag har en kritisk Debian stable -maskin som är väldigt irriterande- den hänger sig sporadiskt och det har eventuellt att göra med en bugg som får kärnan att gå in i en loop vid hög I/O på md (raid1) enheter.
> 
> Hur som helst blir skärmen blank och den reagerar inte ens på AltGr-SysRq utan strömbrytaren är det enda som hjälper.
> 
> Vet någon ifall modulen hangcheck_timer kan vara till nytta i den här situationen?

En watchdog lindrar bara symptomen men löser inte sjukdomen :).

Hangcheck förutsätter dessutom att systemet kommer igång efter en stund
(" It catches hangs and pauses where the system resumes after some time"  -- http://oss.oracle.com/projects/hangcheck-timer/ ), vilket ditt system inte gör vad jag förstår.

> Eller vore det bättre att kompilera en nyare kärna?

Är det en kritisk maskin är väl det bästa att undvika att den hänger alls, och en buggfixad kärna vore därför att föredra.
Jag föreslår att du börjar med kernel-paketet från testing, och ifall inte det funkar så kompilera en egen.

Det kan ju också vara så att det är något fel på hårdvaran som uppstår vid hög last och kanske triggas av att temperaturen blir högre. Har själv haft problem med detta vid några tillfällen. Prova att lägga på extra kyla och se om det blir bättre, eller tillför värme (hårblås?) och se om problemet triggas oftare även vid normal I/O.

Mvh,
 Stefan

Reply to: