[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Kernel BUG at net/core/skbuff.c:91!



Gruesse!
* Ace Dahlmann <Ace@Dahlmann.net> schrieb am [27.07.06 04:38]:
> Hallo zusammen,
> 
> ich habe eben bereits das zweite Mal innerhalb von 2 Wochen eine Kernel
> Panic auf meinem Server gehabt, die zum Komplett-Absturz des Systems
> führte. Nichtmal der MagicSystemKey-Request konnte mir noch helfen

Ich kann dir sicher nicht erschöpfend helfen, aber einige Überlegungen
sind evtl. hilfreich.

> Ich habe die ersten Zeilen eben mal per Hand abgeschrieben:
> 
> --------8<--------
> 
> skput:over: c027dccc:8172 put:8172 dev: eth0 ----[ cut here ]----
> kernel BUG at net/core/skbuff.c:91!
> invalid operand: 0000 [#1]
> Modules linked in: iptable_filter iptables
> 
> CPU: 0
> 
> [...]
> 
> -------->8--------
> 
> - Wegen des "Modules linked" in der Fehlermeldung:

Würde ich als "Information" betrachten, keinesfalls als Ursache.

> Was hat sich an der Kiste geändert:
> 
> - Ich habe eine Realtek 8139too getauscht gegen eine r8169.
> 
> <*> Realtek 8169 gigabit ethernet support
> [*]   Use Rx and Tx Polling (NAPI) (EXPERIMENTAL)   
> 
> In der Tat hatte ich zumindest bei dem Absturz eben eine hohe
> Verbindungs-Last, da ich ein ISO aus dem Netz gesaugt und direkt per
> NFS abgespeichert habe (aber wenn es daran liegen sollte, was hat dann
> iptables damit zu tun?).
> 
> Jedenfalls hab ich "Rx and Tx Polling" jetzt mal ausgeschaltet.
> 
> Allerdings: Kann mein Client denn mit dieser Funktion eine Kernel-Panic
> beim Server verursachen? - nur weil der Server das nicht unterstützt?

Wäre IMHO zumindest eine mögliche Ursache, wohl weniger wegen dem Rx
sondern dem Tx, gerade weil auch experimentell. Evtl. wird clienseitig
mit dieser Option die Server-Seite "geflutet" was zu einem Überlauf und
Verarbeitungsfehler am Server führt. Und das evtl. unabhängig das bei
dir im Moment wohl beim Download<->NFS sicher nicht die volle
Gigabit-Bandbreite genutzt wurde.

Diese Option würde ich also weglassen, gerade weil ich mir nicht sicher
bin ob die Wirkung (unfreundliche FW, Traffic ~ 10K pps (Packets per
Second ?) in deiner Umgebung eine Rolle spielen.

> Wo und wie könnte ich noch debuggen?
> 
> Mehr als ungünstig, dass mir gerade dieser Rechner abschmiert. :(

Dann wirst du wohl nicht versuchen können, eine Situation zu schaffen in
der du den Server "gezielt" zum Absturz bringen kannst?

Ansonsten wohl eher dann ein Fall für die Kernel-ML, dann evtl. einen
Dump ziehen.

Tröstende Worte: vieleicht liegt's ja auch an der Hitze...

> Liebe Grüße,
> Ace


Gruß
	Gerhard
-- 
"Halt die Klappe, ich hab Feierabend"
(Schildkroete)



Reply to: