[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: System killt sich selbst



Körte, Jens schrieb:
> Hallo zusammen!
>
> Dies ist mein erster Beitrag/Frage in die Liste 
> (hoffentlich funktioniert das)
>
> Zum Problem:
> Wir betreiben hier einen ESXi auf einer SUN mit 
> einem RAID5, einem QuadCore und 12GB RAM.
> Soviel zu den Eckdaten.
>
> Auf dem ESXi sind mehrere Rechner installiert, u.a. 
> 4 Debian-Installationen 
> (Linux version 2.6.18-6-686 (Debian 2.6.18.dfsg.1-24))
> und noch 2 Windows-Kisten.
>
> Auf 2 dieser Rechner betreiben wir Webseiten 
> (ca. 30 pro Kiste). Die Performance ist optimal - die 
> Anfragen werden schnell bearbeitet und ausgeliefert.
>
> Wenn wir jedoch anfangen Daten zu kopieren (Platte zu Platte),
> dann können wir folgendes Phänomen beobachten.
> Die Datenrate des Kopiervorgangs wird immer langsamer,
> die Anzahl an Apacheprozessen wird immer höher.
> Das Ganze endet damit, dass der Kopiervorgang quasi stehen
> bleibt (ca. 1MB/Sekunde) und die Kiste extremst ausgelastet
> ist (Befehle in die Konsole tippen geht ganz langsam ...)
> Wir gehen davon aus, dass einzelne Apache-Prozesse nicht 
> mehr auf die Platte zugreifen können und somit die Daten
> nicht mehr ausliefern können. Damit warten sie auf die Daten
> und für weitere Anfragen werden weitere Prozesse gestartet.
> dadurch wird der Kopiervorgang langsamer, da Prozesse nach-
> geladen werden müssen - ihr merkt, die Katze beisst sich in 
> den Schwanz.
>
> Abhilfe können wir nur schaffen, indem wir den Kopiervorgang
> abbrechen und den Indianer neu starten. Das ganze dauert aber
> teilweise bis zu 5 Minuten. 
>
> Um dann Daten kopieren zu können, müssen wir den Rechner
> neustarten und direkt danach den Kopiervorgang starten.
> In diesem Fall läuft die Kiste problemlos weiter und die Daten
> wurden kopiert.
>
> Eine Kontrolle des Raid brachte keine Erkenntnisse. Das Raid
> hat keine Fehler und ist eher gelangweilt.
>
> Dann haben wir auf den anderen Installationen getestet und das
> gleiche Verhalten festgestellt. Jedoch verhalten sich die
> Windows-Rechner, wie man es erwartet, d.h. sie kopieren die 
> Daten ohne Probleme, ohne ins Stocken zu kommen.
>
> Als nächstes hatten wir einer Debian-Installation mehr Ressourcen
> zur Verfügung gestellt. Das hatte jedoch keine Auswirkungen auf
> das Verhalten. Alles in allem zeigen die Systemmonitore des ESXi,
> dass der Rechner nur wenig ausgelastet ist 
> (CPU ca. 30%, RAM 20%, ...).
> Bei einem Kopiervorgang schnellt kurzzeitig die Anzeige für die 
> Plattenaktivität hoch, geht dann aber wieder auf Normalanzeige.
>
> Zusätzlich haben wir festgestellt, dass die Uhr bei solchen 
> Hängern quasi stehen bleibt. Die Synchronisation mit einem 
> NTP-Dienst stellt zwar die Zeit wieder her, aber mittlerweile 
> waren bis zu 300 Sekunden Differenz aufgelaufen.
>
> Wir sind echt am Verzweifeln, da dieses Phänomen erst seit kurzem
> aufgetreten ist. Der Unterschied zu vorher ist, dass jetzt 4 
> virtuelle Maschinen installiert sind und nicht 2, wie vorher.
> Wichtig! Installiert - nicht an, d.h. wir haben die 2 neuen 
> Installationen ausgeschaltet (runtergefahren). Lediglich die 
> Installation liegt auf der Platte rum.
>
> Hatte jemand schon mal das gleiche Problem? Oder kann da jemand
> einen Ansatz geben, wie wir hier das Problem beheben können?
>
> Grüße und Danke schonmal fürs Lesen :-)
> Jens
>   
Wie genau werden die Daten kopiert? Und was hat das mit Apache zu tun?
Welche Virtaualisierung benutzt Ihr?

Grüße nach Kreuznach (Ihr habt eine herrliche Therme! Vom Wein ganz
abgesehen!)


Reply to: