[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

OOM killer schießt mein System ab (XEN Problem?)



Hallo allerseits,

ich habe folgendes Problem:
Ich habe ein Squeeze i386 auf Wheezy amd64 "geupgraded". Sprich Wheezy 
installiert und dann die Konfiguration rüber gezogen.

Nebenbei habe ich noch XEN installeirt, da ich mit transmission arbeiten 
möchte, aber meine Firewall nicht für alle Port uneingeschränkt aufmachen 
möchte. Dann soll der Client auf eine DomU.

In meiner Dom0 habe ich jetzt zuächst alle Programme, die auf dem alten System 
so vorhanden waren installiert. Das war unter anderem apache2, courier, mysql, 
postgresql,... (Die Maschiene dient als Heimserver).
Ich habe dann immer wieder das Problem bekommen, dass der OOM killer mir 
Prozesse abgeschossen hat. Ich dachte zu nächst, dass zu wenig RAM für zu 
viele (große) Prozesse in der Dom0 zur Verfügung stehen würde. Also habe ich 
apache, postgresql und mysql deaktiviert und in DomUs gepackt [1]. Zu diesem 
Zeitpunkt waren keine anderen DomUs aktiv.

Wenn ich das System jetz unter Last bringe (z.B. schreiben auf ein 
verschlüsseltes Dateisystem), kommt es wieder zum OOM Problem. Dabei wird 
meist der rsyslod zerstöret, weshalb ich keine Logs vom killer habe. Auch ein 
manuelles Eingreifen ist meist nicht mehr möglich, dass der SSH Daemon nicht 
mehr lebt und ein Zugriff unter der Konsole meist hängt. Das System scheint 
einzufrieren.

Was ich aber habe ist die minütliche Ausgabe von atop:
Diese sagt, dass mein System mit 880MB RAM vor dem Crash rund 440MB Cache hat 
und einige MB Puffer sowie rd. 20MB frei. Der 25GB Swap Bereich ist frei.

* Warum beginnt der Kernel nicht zu swappen, also Daten in den Swap zu 
befördern? Performanceeinbußen sind doch wesentlich weniger schlimm als ein 
abgestürztes System!
* Warum wird der Cache nicht platt gemacht? Der liegt ja eh auf der HD oder wo 
auch immer. Er ist nur da, damit der Zugriff schneller geht. Auch hier könnte 
man drüber schrieben, wenn Not am Manne ist.
* Hat jemand so ein Problem schon einmal gesehn? Ich vermute einen 
Zusammenhang mit XEN.
* Könnte es sich auch um ein Hardwareproblem handeln [2]?

Ich hoffe ihr könnt mir helfen. Ich bin echt am verzweifeln, weil ich die Welt 
(oder Linux in dem Falle) nicht mehr verstehe.

Christian



[1] Ich habe eine feste RAM Größe von 1GB=880MB für Dom0 festgelegt. Ich weiß, 
dass ich auch einfach diese vergrößern könnte, aber ich wollte den apache eh 
in einer DomU langfristig laufen lassen.

[2] Ich bekomme manchmal auf der Konsole eine Meldung des Kernels, dass ein 
Task mehr als 120 Sekunden blokiert wäre oder so. Der Task hat irgendwas mit 
meinem Soft-RAID zu tun (jbd2/raid/...). Ich weiß aber nicht, ob das Warten 
Ursache oder Wirkung des Killens von Prozessen ist. Die Frage wäre dann auch, 
ob eher der RAM oder die HD(s) das Problem sind. Bei den HDs habe ich eine in 
verdacht, aber gut, diese werde ich bei Zeit mal austauschen müssen.

Attachment: signature.asc
Description: This is a digitally signed message part.


Reply to: