Hallo allerseits, ich habe folgendes Problem: Ich habe ein Squeeze i386 auf Wheezy amd64 "geupgraded". Sprich Wheezy installiert und dann die Konfiguration rüber gezogen. Nebenbei habe ich noch XEN installeirt, da ich mit transmission arbeiten möchte, aber meine Firewall nicht für alle Port uneingeschränkt aufmachen möchte. Dann soll der Client auf eine DomU. In meiner Dom0 habe ich jetzt zuächst alle Programme, die auf dem alten System so vorhanden waren installiert. Das war unter anderem apache2, courier, mysql, postgresql,... (Die Maschiene dient als Heimserver). Ich habe dann immer wieder das Problem bekommen, dass der OOM killer mir Prozesse abgeschossen hat. Ich dachte zu nächst, dass zu wenig RAM für zu viele (große) Prozesse in der Dom0 zur Verfügung stehen würde. Also habe ich apache, postgresql und mysql deaktiviert und in DomUs gepackt [1]. Zu diesem Zeitpunkt waren keine anderen DomUs aktiv. Wenn ich das System jetz unter Last bringe (z.B. schreiben auf ein verschlüsseltes Dateisystem), kommt es wieder zum OOM Problem. Dabei wird meist der rsyslod zerstöret, weshalb ich keine Logs vom killer habe. Auch ein manuelles Eingreifen ist meist nicht mehr möglich, dass der SSH Daemon nicht mehr lebt und ein Zugriff unter der Konsole meist hängt. Das System scheint einzufrieren. Was ich aber habe ist die minütliche Ausgabe von atop: Diese sagt, dass mein System mit 880MB RAM vor dem Crash rund 440MB Cache hat und einige MB Puffer sowie rd. 20MB frei. Der 25GB Swap Bereich ist frei. * Warum beginnt der Kernel nicht zu swappen, also Daten in den Swap zu befördern? Performanceeinbußen sind doch wesentlich weniger schlimm als ein abgestürztes System! * Warum wird der Cache nicht platt gemacht? Der liegt ja eh auf der HD oder wo auch immer. Er ist nur da, damit der Zugriff schneller geht. Auch hier könnte man drüber schrieben, wenn Not am Manne ist. * Hat jemand so ein Problem schon einmal gesehn? Ich vermute einen Zusammenhang mit XEN. * Könnte es sich auch um ein Hardwareproblem handeln [2]? Ich hoffe ihr könnt mir helfen. Ich bin echt am verzweifeln, weil ich die Welt (oder Linux in dem Falle) nicht mehr verstehe. Christian [1] Ich habe eine feste RAM Größe von 1GB=880MB für Dom0 festgelegt. Ich weiß, dass ich auch einfach diese vergrößern könnte, aber ich wollte den apache eh in einer DomU langfristig laufen lassen. [2] Ich bekomme manchmal auf der Konsole eine Meldung des Kernels, dass ein Task mehr als 120 Sekunden blokiert wäre oder so. Der Task hat irgendwas mit meinem Soft-RAID zu tun (jbd2/raid/...). Ich weiß aber nicht, ob das Warten Ursache oder Wirkung des Killens von Prozessen ist. Die Frage wäre dann auch, ob eher der RAM oder die HD(s) das Problem sind. Bei den HDs habe ich eine in verdacht, aber gut, diese werde ich bei Zeit mal austauschen müssen.
Attachment:
signature.asc
Description: This is a digitally signed message part.