[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

INFO: task ... blocked for more than 120 seconds



Hallo Leute,

derartige Meldungen hatte ich heute auf der Konsole meines Servers. Es
betrifft verschiedene tasks wie flush, kjournald, nfsd.
Die Kiste läuft mit Squeeze und Kernel 2.6.32-5-686, hat 256 MB RAM und
2 x 2,5" SATA Platten als Soft-RAID1. Drauf laufen ein Apache, nfs, ntp,
apt-cacher-ng, ramlog.

Soeben ist mir im Log aufgefallen, das diese Meldungen genau zu der Zeit
(heute Nacht) generiert wurden, als der md-array data check gelaufen
ist. Könnte also die Belastung des md-raid durch die Überprüfung die
Ursache sein?

Meine Suche brachte verschiedene Informationen zu älteren Kernel zutage.
Vor einiger Zeit - nach der Umstellung Lenny-Squeeze - hatte ich schon
mal solche Meldungen.
Soweit ich das verstehe, handelt es sich um einen Bug des Kernel in
Bezug auf das Leeren des Caches. Geht das nicht schnell genug, weil
vielleicht das IO-Subsystem (Platten, Controller) nicht schnell genug
ist, wird der Timeout von 120 Sekunden überschritten und die Meldung
erzeugt. Ist das richtig?

Mich verwirrt, das dieser Bug immer noch vorhanden ist, zumal ich öfter
gelesen habe, das er vor allem bei Maschinen mit viel RAM aufgetreten
ist. Bei dieser Kiste kann man wohl kaum von "viel" sprechen ;-)

Ein "Ronny Egner" schreibt im Oktober 2011 dazu in seinem Blog:
"The problem is solved in later kernels and there is not “fix” from
Oracle. I fixed this by lowering the mark for flushing the cache from
40% to 10% by setting “vm.dirty_ratio=10″ in /etc/sysctl.conf."

Okay, ist 2.6.32 schon ein "later"? Ist das Problem unter Wheezy
erledigt? Was meint ihr zu diesem Vorschlag? Ich würde gern solche
"Probleme" lösen beziehungsweise abhaken, bevor ich die Kiste auf Wheezy
aktualisiere.

-- 


Mit freundlichem Gruß
Jan Kappler


Attachment: signature.asc
Description: OpenPGP digital signature


Reply to: