Re: Kernel Bug?
Hallo Andre!
Ansich handelt es sich nicht um einen Bug sondern um ein Feature. Für
nähere Info kannst Du hier mal einen Blick werfen:
https://www.kernel.org/doc/Documentation/lockup-watchdogs.txt
Verursacht wir das Problem durch hohe I/O-Last die einen Thread dazu
zwingt, auf selbiges I/O-Gerät zu warten.
Bei 3ware-Controllern empfielt es sich, den Modul-Parameter "use_msi"
auf 1 zu setzen, da Message-Signaled Interrupts i.d.R. flotter
abgearbeitet werden. Per default werden vom Treiber (3w_sas, 3w_9xxx)
normale HW-Interrupts genutzt.
Mit freundlichen Grüßen
Michael Weiß
Geschäftsführer Clusters GmbH
-------
Tel : +49 341 39299620
Fax : +49 341 39299628
Web : http://www.clusters.de
Mail : mw@clusters.de
Anschrift : Atriumstraße 1 * 04315 Leipzig
Handelsregister : HRB 30654, AG Leipzig
USt-Ident-Nr. : DE 249648590
Steuer-Nr. : 232/107/09045, FA Leipzig I
Am 26.05.2015 um 16:12 schrieb Andre Tann:
> Hallo zusammen,
>
> übers Wochenende habe ich auf einem Server eine frische
> Jessie-Installation aufgesetzt, und ich sehe dort in regelmäßigen
> Abständen folgendes:
>
> ===Schnipp
> Message from syslogd@file02 at May 26 09:02:19 ...
> kernel:[394732.080003] BUG: soft lockup - CPU#0 stuck for 22s! [rsync:3663]
>
> Message from syslogd@file02 at May 26 09:02:47 ...
> kernel:[394760.080004] BUG: soft lockup - CPU#0 stuck for 22s! [rsync:3663]
>
> Message from syslogd@file02 at May 26 09:03:19 ...
> kernel:[394792.080003] BUG: soft lockup - CPU#0 stuck for 22s! [rsync:3663]
>
> Message from syslogd@file02 at May 26 09:03:47 ...
> kernel:[394820.080003] BUG: soft lockup - CPU#0 stuck for 22s! [rsync:3663]
>
> Message from syslogd@file02 at May 26 09:04:23 ...
> kernel:[394856.080004] BUG: soft lockup - CPU#0 stuck for 22s! [rsync:3663]
> ===schnapp
>
> In der Tat laufen gerade zwei rsync-Jobs: einer, der die Daten von außen
> auf die Kiste draufkopiert, und noch einer, der intern von einer Platte
> auf die andere kopiert.
>
> Der Punkt ist nun folgender: Ursprünglich lief die Kiste unter Squeeze,
> und da gabs diese Meldungen auch schon. Darauf habe ich mich
> entschlossen, auf Jessie zu warten in der Hoffnung, der Bug wäre dort
> behoben.
> Davor lief die Kiste für ca. 4 Jahre ohne Probleme mit einer
> SuSE-Installation.
>
> Aus dem Server habe ich nun schon den RAID-Controller rausgeworfen
> (3ware 9650) und auch neue Platten eingebaut, um Hardware möglichst
> auszuschließen. Aber das ergab keine Änderung.
>
>
> Hat nun irgend jemand eine Idee, in welcher Richtung ich suchen könnte?
>
>
> Danke fürs Lesen
>
Reply to: