Re: OOM killer schießt mein System ab (XEN Problem?)
Hi!
On Friday 05 July 2013 13:42:56 Christian wrote:
(...)
> [2] Ich bekomme manchmal auf der Konsole eine Meldung des Kernels, dass ein
> Task mehr als 120 Sekunden blokiert wäre oder so. Der Task hat irgendwas
> mit meinem Soft-RAID zu tun (jbd2/raid/...). Ich weiß aber nicht, ob das
> Warten Ursache oder Wirkung des Killens von Prozessen ist. Die Frage wäre
> dann auch, ob eher der RAM oder die HD(s) das Problem sind. Bei den HDs
> habe ich eine in verdacht, aber gut, diese werde ich bei Zeit mal
> austauschen müssen.
Da hast du dein Problem schon selber beschrieben.
Aus irgend einem Grund ist der Zugriff auf eine Raidhälfte nicht möglich. Der
timeout liegt bei 120 Sec. und kann mit
echo 0 > /proc/sys/kernel/hung_task_timeout_secs
auf Null gesetzt werden. Achtung! Dann hast du aber gleich bei dem ersten
Hänger ein degraded Raid!
Deine hohe last, also das scheinbare eingefroren sein, Rührt also von den
Prozessen die auf IO warten. Das ganze schaukelt sich mit der Zeit hoch.
Das würde auch erklähren warum Das System nicht Swapt. Es kann nicht weil es
nicht an die Platte kommt.
Warum allerdings der oom Killer zu schlägt, kann ich in dem Zusammenhang nur
vermuten. Mglw. Schaukeln sich so viele wartenden Prozesse hoch das der RAM
aus geht?
Reply to: