[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

System killt sich selbst



Hallo zusammen!

Dies ist mein erster Beitrag/Frage in die Liste 
(hoffentlich funktioniert das)

Zum Problem:
Wir betreiben hier einen ESXi auf einer SUN mit 
einem RAID5, einem QuadCore und 12GB RAM.
Soviel zu den Eckdaten.

Auf dem ESXi sind mehrere Rechner installiert, u.a. 
4 Debian-Installationen 
(Linux version 2.6.18-6-686 (Debian 2.6.18.dfsg.1-24))
und noch 2 Windows-Kisten.

Auf 2 dieser Rechner betreiben wir Webseiten 
(ca. 30 pro Kiste). Die Performance ist optimal - die 
Anfragen werden schnell bearbeitet und ausgeliefert.

Wenn wir jedoch anfangen Daten zu kopieren (Platte zu Platte),
dann können wir folgendes Phänomen beobachten.
Die Datenrate des Kopiervorgangs wird immer langsamer,
die Anzahl an Apacheprozessen wird immer höher.
Das Ganze endet damit, dass der Kopiervorgang quasi stehen
bleibt (ca. 1MB/Sekunde) und die Kiste extremst ausgelastet
ist (Befehle in die Konsole tippen geht ganz langsam ...)
Wir gehen davon aus, dass einzelne Apache-Prozesse nicht 
mehr auf die Platte zugreifen können und somit die Daten
nicht mehr ausliefern können. Damit warten sie auf die Daten
und für weitere Anfragen werden weitere Prozesse gestartet.
dadurch wird der Kopiervorgang langsamer, da Prozesse nach-
geladen werden müssen - ihr merkt, die Katze beisst sich in 
den Schwanz.

Abhilfe können wir nur schaffen, indem wir den Kopiervorgang
abbrechen und den Indianer neu starten. Das ganze dauert aber
teilweise bis zu 5 Minuten. 

Um dann Daten kopieren zu können, müssen wir den Rechner
neustarten und direkt danach den Kopiervorgang starten.
In diesem Fall läuft die Kiste problemlos weiter und die Daten
wurden kopiert.

Eine Kontrolle des Raid brachte keine Erkenntnisse. Das Raid
hat keine Fehler und ist eher gelangweilt.

Dann haben wir auf den anderen Installationen getestet und das
gleiche Verhalten festgestellt. Jedoch verhalten sich die
Windows-Rechner, wie man es erwartet, d.h. sie kopieren die 
Daten ohne Probleme, ohne ins Stocken zu kommen.

Als nächstes hatten wir einer Debian-Installation mehr Ressourcen
zur Verfügung gestellt. Das hatte jedoch keine Auswirkungen auf
das Verhalten. Alles in allem zeigen die Systemmonitore des ESXi,
dass der Rechner nur wenig ausgelastet ist 
(CPU ca. 30%, RAM 20%, ...).
Bei einem Kopiervorgang schnellt kurzzeitig die Anzeige für die 
Plattenaktivität hoch, geht dann aber wieder auf Normalanzeige.

Zusätzlich haben wir festgestellt, dass die Uhr bei solchen 
Hängern quasi stehen bleibt. Die Synchronisation mit einem 
NTP-Dienst stellt zwar die Zeit wieder her, aber mittlerweile 
waren bis zu 300 Sekunden Differenz aufgelaufen.

Wir sind echt am Verzweifeln, da dieses Phänomen erst seit kurzem
aufgetreten ist. Der Unterschied zu vorher ist, dass jetzt 4 
virtuelle Maschinen installiert sind und nicht 2, wie vorher.
Wichtig! Installiert - nicht an, d.h. wir haben die 2 neuen 
Installationen ausgeschaltet (runtergefahren). Lediglich die 
Installation liegt auf der Platte rum.

Hatte jemand schon mal das gleiche Problem? Oder kann da jemand
einen Ansatz geben, wie wir hier das Problem beheben können?

Grüße und Danke schonmal fürs Lesen :-)
Jens


Jens Körte
webIT / Stellvertretender Teamleiter
------------------------------------------------------------------------
odd GmbH & Co.KG Print und Medien
Otto-Meffert-Straße 5
D-55543 Bad Kreuznach
Tel:    +49 671 88744-241
Fax:    +49 671 88744-9241
e-mail: j.koerte@odd.de
------------------------------------------------------------------------
Geschäftsführung:   Klaus Meffert, Michael Kappler, Alexander Haßinger
Umsatzsteuer-IdNr.: DE 148090212
Registergericht:    Bad Kreuznach HRB 20393
------------------------------------------------------------------------
Mehr Informationen unter http://www.odd.de 
------------------------------------------------------------------------
Der Inhalt dieser E-Mail und die daran angehängten und übersandten Dateien sind ausschliesslich für die bezeichneten Adressaten bestimmt. Wenn Sie kein vorgesehener Adressat dieser E-Mail oder dessen Vertreter sein sollten, so informieren Sie bitte den Absender und löschen Sie bitte diese E-Mail. Beachten Sie bitte, dass jede Form der Kenntnisnahme, Veröffentlichung, Vervielfältigung oder Weitergabe des Inhalts dieser E-Mail unzulässig ist. Warnung: Diese E-Mail kann trotz umfangreicher Vorsichtsmaßnahmen der Firma odd GmbH & Co. KG Print und Medien Viren enthalten. Die Firma odd GmbH & Co. KG Print und Medien kann für entstehenden Verlust oder Beschädigung von Daten, die durch "Öffnen" dieser E-Mail oder seiner Anhänge hervorgerufen werden könnten, keinerlei Verantwortung übernehmen.

This message and any attached file are for the designated recipients only and may contain privileged, proprietary, or otherwise private information. If you have received it in error, please notify the sender immediately and delete the original. Any other use of the mail by you is prohibited. Warning: Although odd GmbH & Co. KG Print und Medien has taken reasonable precautions to ensure no viruses are present in this email, the company cannot accept responsibility for any loss or damage arising from the use of this email or attachments.


Reply to: