[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: OOM killer schießt mein System ab (XEN Problem?)



Hi!

On Friday 05 July 2013 13:42:56 Christian wrote:
(...)
> [2] Ich bekomme manchmal auf der Konsole eine Meldung des Kernels, dass ein
> Task mehr als 120 Sekunden blokiert wäre oder so. Der Task hat irgendwas
> mit meinem Soft-RAID zu tun (jbd2/raid/...). Ich weiß aber nicht, ob das
> Warten Ursache oder Wirkung des Killens von Prozessen ist. Die Frage wäre
> dann auch, ob eher der RAM oder die HD(s) das Problem sind. Bei den HDs
> habe ich eine in verdacht, aber gut, diese werde ich bei Zeit mal
> austauschen müssen.

Da hast du dein Problem schon selber beschrieben.
Aus irgend einem Grund ist der Zugriff auf eine Raidhälfte nicht möglich. Der 
timeout liegt bei 120 Sec. und kann mit 
echo 0 > /proc/sys/kernel/hung_task_timeout_secs 
auf Null gesetzt werden. Achtung! Dann hast du aber gleich bei dem ersten 
Hänger ein degraded Raid!

Deine hohe last, also das scheinbare eingefroren sein, Rührt also von den 
Prozessen die auf IO warten. Das ganze schaukelt sich mit der Zeit hoch.
Das würde auch erklähren warum Das System nicht Swapt. Es kann nicht weil es 
nicht an die Platte kommt.
Warum allerdings der oom Killer zu schlägt, kann ich in dem Zusammenhang nur 
vermuten. Mglw. Schaukeln sich so viele wartenden Prozesse hoch das der RAM 
aus geht?


Reply to: