[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: OOPs bei kswapd



Gruesse!
* Richard Mittendorfer <delist@gmx.net> schrieb am [18.07.05 16:11]:
> Also sprach Gerhard Brauer <gerhard.brauer@web.de> (Mon, 18 Jul 2005
> 14:37:43 +0200):

> > Gruesse!
> > 
> > Kann mir jemand einen Tip geben, warum bei einem Rechner der kswapd
> > Daemon im laufenden Betrieb stirbt?
> > 
> > Ich kriege einen Kernel-OOPs ins syslog, der kswapd steht danach als
> > defunct in der Prozeßliste. Der Rechner läuft anschließend "relativ"
> > normal weiter (außer sendmail/exim)
> > [...]
> 
> ist's immer der kswapd? 

Ja, immer der kswapd. *Nach* dem oops haben dann clamav und exim
Probleme. clamav kann auf seinen socket nicht mehr zugreifen und exim
versendet keine Mails mehr. Ich habe es als Folgeprobleme eingestuft da
der Rechner scheinbar ja kein paging (sowohl in wie out) mehr machen
kann.

Der PC ist ein alter K6 266 mit 96 MB RAM (EDO), der als Router,Firwall
und Mail/IMAP-Server dient.

Ursprünglich dachte ich beim Betrieb des Rechners, er hätte ein diffuses
Problem. Ich kontrolliere diesen PC ausschließlich über ssh bzw.
aufgrund von Meldungen von logcheck. Und laut Anwendet vor Ort gingen
immer mal wieder "Internet" nicht, "Netzwerk geht nicht", etc.
Zu diesem Zeitpunkt habe ich den Rechner mal schonmal eine Zeit mit
Stresstest überzogen und letztendlich den Software-Watchdog aktiviert
und konfiguriert. Die Ursache des Ganzen entpuppte sich aber später als
ein kaputter Switch im LAN ("Scheißproblem": vergaß zeitweise die
MAC-Adressen bzw. der Switch-Speicher defekt).

Dies nur als Hinweis, das der Rechner eigentlich stabil ist, bis auf das
kswapd Problem, was vor ca. 4-5 Wochen das erstemal aufgetaucht ist. Der
Zeitpunkt könnte latürnich auf einen beginnenden Hardware-Defekt deuten.

> wie sieht's mit nfs-last, find in / oder
> kernelbauen aus? das wuerde dann eher auf ein kaputtes rammodul
> hinweisen - mal (lange) mit memtest86 testen.

RAM könnte sein. Intensiv testen (find, etc) kann ich erst heute nacht,
memtest erst wenn ich mal wieder vor Ort bin. Allerdings habe ich keine
Effekte (kaputte Dateien/Filesystem), die ansonst noch auf einen
RAM-Defekt hindeuten würden.

> ich glaube kaum, dass es sich um einen plattenfehler handelt, aber SMART
> koennte da sicherheit geben. mir waer aber kein zusammenhang bekannt.
> (smartctl, smartmon-tools)

Ich eigentlich auch nicht (außer sagen wir in dem Sektoren-Bereich wo
außgerechnet die Swap-Partition liegt). Mit sowas gehen aber meiner
Erfahrung nach read/write Errormeldungen im syslog einher (außer evtl.
halt beim swap fs ?). Smart ist mit dieser Festplatte und mit diesem PC
soweit ich weiß noch nicht möglich.

> kernel-version bekommst du mit "$ uname -r", wenn die sehr out-of-date
> ist, dann updaten (eventuell aber bei der 2.X-version bleiben, da sonst
> noch anderes noetig sein wird: modules-init-tools,..). hier gilt aber
> selbiges: sehe keinen zusammenhang mit deinem oops.

Ist ein 2.4.27 oder 2.4.29. Mit xx?? wollte ich sagen, ich kann ohne auf
den Rechner zu gehen momentan die genaue Minor-Version nicht sagen. Aber
sooo out-of-date ist er sicher nicht. <Doku-Kramen...> Ah, ist der
letzte stavile 2.4er von backports.org.

> poste mal die fehlermeldung aus messages, schau dir ksymoops an.

Den oops hänge ich als Text an. Ich habe den oops mal hier lokal an
ksymoops verfüttert, aber richtig sinnvoll ist das doch nur, wenn ich es
auf dem betroffenen Rechner mache? 

> sl ritch

Gruß Gerhard

-- 
Try rm -rf (_R_ead _M_ail _R_ealy _F_ast)
Jul 18 06:26:22 bastille kernel: Unable to handle kernel paging request at virtual address 00020014
Jul 18 06:26:22 bastille kernel:  printing eip:
Jul 18 06:26:22 bastille kernel: c0146e8e
Jul 18 06:26:22 bastille kernel: *pde = 00000000
Jul 18 06:26:22 bastille kernel: Oops: 0000
Jul 18 06:26:22 bastille kernel: CPU:    0
Jul 18 06:26:22 bastille kernel: EIP:    0010:[prune_dcache+206/344]    Not tainted
Jul 18 06:26:22 bastille kernel: EFLAGS: 00010206
Jul 18 06:26:22 bastille kernel: eax: 00020000   ebx: c002a178   ecx: c0eccd70   edx: c0eccd70
Jul 18 06:26:22 bastille kernel: esi: c002a160   edi: c0eccd60   ebp: 0000030b   esp: c10c5f6c
Jul 18 06:26:22 bastille kernel: ds: 0018   es: 0018   ss: 0018
Jul 18 06:26:22 bastille kernel: Process kswapd (pid: 4, stackpage=c10c5000)
Jul 18 06:26:22 bastille kernel: Stack: 0000003c 000001d0 0000001b c02453bc c014719b 000004da c012e92c 00000006 
Jul 18 06:26:22 bastille kernel:        000001d0 c02453bc 00000001 c10c4000 00000000 00000007 c10c5fa8 00000000 
Jul 18 06:26:22 bastille kernel:        c012eaaa c02452e0 00000000 c10c4249 0008e000 c012eb16 c02452e0 c10c4000 
Jul 18 06:26:22 bastille kernel: Call Trace:    [shrink_dcache_memory+27/52] [try_to_free_pages_zone+120/232] [kswapd_balance_pgdat+86/164] [kswapd_balance+30/52] [kswapd+153/180]
Jul 18 06:26:22 bastille kernel:   [arch_kernel_thread+40/56]
Jul 18 06:26:22 bastille kernel: 
Jul 18 06:26:22 bastille kernel: Code: 8b 40 14 85 c0 74 0b 57 56 ff d0 83 c4 08 eb 12 89 f6 57 e8 
Jul 18 06:26:22 bastille kernel:  printing eip:
Jul 18 06:26:22 bastille kernel: c0146e8e
Jul 18 06:26:22 bastille kernel: Oops: 0000
Jul 18 06:26:22 bastille kernel: CPU:    0
Jul 18 06:26:22 bastille kernel: EIP:    0010:[prune_dcache+206/344]    Not tainted
Jul 18 06:26:22 bastille kernel: EFLAGS: 00010206
Jul 18 06:26:22 bastille kernel: eax: 00020000   ebx: c002a178   ecx: c0eccd70   edx: c0eccd70
Jul 18 06:26:22 bastille kernel: esi: c002a160   edi: c0eccd60   ebp: 0000030b   esp: c10c5f6c
Jul 18 06:26:22 bastille kernel: ds: 0018   es: 0018   ss: 0018
Jul 18 06:26:22 bastille kernel: Process kswapd (pid: 4, stackpage=c10c5000)
Jul 18 06:26:22 bastille kernel: Stack: 0000003c 000001d0 0000001b c02453bc c014719b 000004da c012e92c 00000006 
Jul 18 06:26:22 bastille kernel:        000001d0 c02453bc 00000001 c10c4000 00000000 00000007 c10c5fa8 00000000 
Jul 18 06:26:22 bastille kernel:        c012eaaa c02452e0 00000000 c10c4249 0008e000 c012eb16 c02452e0 c10c4000 
Jul 18 06:26:22 bastille kernel: Call Trace:    [shrink_dcache_memory+27/52] [try_to_free_pages_zone+120/232] [kswapd_balance_pgdat+86/164] [kswapd_balance+30/52] [kswapd+153/180]
Jul 18 06:26:22 bastille kernel:   [arch_kernel_thread+40/56]
Jul 18 06:26:22 bastille kernel: 
Jul 18 06:26:22 bastille kernel: Code: 8b 40 14 85 c0 74 0b 57 56 ff d0 83 c4 08 eb 12 89 f6 57 e8 
Jul 18 06:26:22 bastille kernel: Unable to handle kernel paging request at virtual address 00020014
Jul 18 06:26:22 bastille kernel:  printing eip:
Jul 18 06:26:22 bastille kernel: c0146e8e
Jul 18 06:26:22 bastille kernel: *pde = 00000000
Jul 18 06:26:22 bastille kernel: Oops: 0000
Jul 18 06:26:22 bastille kernel: CPU:    0
Jul 18 06:26:22 bastille kernel: EIP:    0010:[prune_dcache+206/344]    Not tainted
Jul 18 06:26:22 bastille kernel: EFLAGS: 00010206
Jul 18 06:26:22 bastille kernel: eax: 00020000   ebx: c002a178   ecx: c0eccd70   edx: c0eccd70
Jul 18 06:26:22 bastille kernel: esi: c002a160   edi: c0eccd60   ebp: 0000030b   esp: c10c5f6c
Jul 18 06:26:22 bastille kernel: ds: 0018   es: 0018   ss: 0018
Jul 18 06:26:22 bastille kernel: Process kswapd (pid: 4, stackpage=c10c5000)
Jul 18 06:26:22 bastille kernel: Stack: 0000003c 000001d0 0000001b c02453bc c014719b 000004da c012e92c 00000006 
Jul 18 06:26:22 bastille kernel:        000001d0 c02453bc 00000001 c10c4000 00000000 00000007 c10c5fa8 00000000 
Jul 18 06:26:22 bastille kernel:        c012eaaa c02452e0 00000000 c10c4249 0008e000 c012eb16 c02452e0 c10c4000 
Jul 18 06:26:22 bastille kernel: Call Trace:    [shrink_dcache_memory+27/52] [try_to_free_pages_zone+120/232] [kswapd_balance_pgdat+86/164] [kswapd_balance+30/52] [kswapd+153/180]
Jul 18 06:26:22 bastille kernel:   [arch_kernel_thread+40/56]
Jul 18 06:26:22 bastille kernel: 
Jul 18 06:26:22 bastille kernel: Code: 8b 40 14 85 c0 74 0b 57 56 ff d0 83 c4 08 eb 12 89 f6 57 e8 

Reply to: