[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

CLOSE_WAIT und hängende Logouts



Hallo, Mitlister...

eigentlich halte ich mich nicht für völlig doof, was die Verwaltung von
TCP/IP und Sockets im Linux-Kernel angeht, aber hier stehe ich etwas auf
dem virtuellen Schlauch...

Ich betreibe drei Proxy-Server (hinter einem vorgeschalteten
Hardware-Loadbalancer) mit Squid und einem weiteren (kommerziellen)
URL-Filter in einer Proxy-Kaskade. Diese Server fliegen mir gerade
reihenweise um die Ohren. Teilweise kann ich die TCP-Ports der Daemonen
gar nicht mehr erreichen oder werde sofort wieder rausgeworfen (RST),
bevor ich überhaupt etwas senden kann.

Was auffällig ist: die Anzahl der Sockets im Zustand CLOSE_WAIT geht
irre hoch (bis zu 1650). Ich überwache das mit Cricket und sehe, dass
die Anzahl stetig steigt. Liegt das möglicherweise an der Anwendung, die
die Sockets nicht freigibt? Oder hat der Kernel ein Problem? Ich lasse
den Installationskernel bf24 (2.4.18-bf2) laufen und habe lediglich ein
paar ulimits hochgeschraubt. Kann ich irgendwie feststellen, wieviele
freie Socket ich noch habe, um mich rechtzeitig vor dem Breakdown noch
mit Netsaint warnen zu lassen? In /proc/sys/net/ipv4 bin ich noch nicht
fündig geworden.

Ein weiterer Effekt, der damit möglicherweise etwas zu tun: ich logge
mich auf den Kisten ganz normal mit SSH ein. Wenn ich mich auslogge,
wird die SSH-Verbindung nicht korrekt abgebaut. Ich sehe noch
"logout\n", aber komme nicht mehr auf meinen Rechner zurück. Ich kann
dann nur mit der Escape-Sequenz (~.) raus oder das xterm hart schließen.
Hat das damit möglicherweise zu tun? Es laufen keine Prozesse in der
shell ('jobs' zeigt nichts an), die irgendwelche Streams offen halten
könnten. Als Shell nehme ich die normale bash. Das passiert übrigens
nicht immer, hängt aber anscheinend kausal

Würde mich über Tipps oder (on-topic-)Kommentare freuen. (Falls es
jemanden juckt, mir "frag gefälligst den Hersteller der Software" zu
schreiben... Der Hersteller bietet zwar guten Support und sucht auch
parallel nach einem Fehler. Mir geht es darum, selbst zu verstehen, wie
die CLOSE_WAITs zustande kommen und nach welchen Kriterien sie wieder
verschwinden.)

 Christoph

-- 
~
~
".signature" [Modified] 3 lines --100%--                3,41         All



Reply to: