[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: SMP -> kernel panic



High, high ...
* Charles Imbusch <CImbusch@gmx.net> schrieb am [09.09.03 00:03]:
 
> Ist auch nen Versuch wert. Aber kann es denn wirklich sein, dass ein
> Programm, das nur für eine cpu compiliert wurde, das ganze OS zum
> Stillstand bringen kann?

Normalerweise eigentlich nicht, udn die Wahrscheinlichkeit wird geringer
je weniger system/hardware-nah die Programme sind. Es gibt ja kaum
Programme, die sich anders verhalten wenn sie SMP vorfinden.  Aber die
fertig kompilierten Programme sind ja für eine allgemeine Plattform
gebaut, also minimal 386 bzw. Pentium. Da sind dann evtl. nicht alle
Optimierungen bzw. Prozessor-Besonderheiten enthalten die du bei einer
eigenen Kompilierung unter deinem System bekommst. Nimm mal allein den
Unterschied zwischen AMDs und Intels. Und bei deinem System mußt du
diese *Möglichkeit* auch noch mit der Anzahl deiner CPUs potenzieren.
Also Murphy würde ganz klar sagen: ja

Außerdem ist es ja nur eine Möglichkeit von vielen. Gerade bei solchen
Problemen wie deinem, die sich nicht direkt auf eine bestimmte Ursache
zurückführen lassen bzw. nicht reproduzieren lassen, ist es IMHO wichtig
eine logische Fehlersucheinkreismethode zu finden, die alle
Möglichkeiten einer Fehlerbehebung erstmal erfasst und dann nach
Wahrscheinlichkeit sortiert. Das Selbstkompilieren ist also eine
Möglichkeit, aber die Wahrscheinlichkeit als Fehlerursache momentan eher
gering. Siehe auch weiter unten.

> Der Fehler tritt nicht "nur" bei Samba auf, z.B. wie oben erwähnt auch
> teilweise mit nmap, was du vorher natürlich nicht wußtest.

nmap ist wie samba (zumindest bei deiner Fehlerbedingung) ja ein
netzwerk-lastiges Programm. Jetzt wäre doch interessant, im Sinne der
logischen Fehlersucheinkreismethode ;-) zu probieren, ob die panics nur
oder immer im Zusammenhang mit "echtem" Netzwerktraffic auftreten.

Ich würde z.B. noch eine netzwerk-lastige Prüfmethode (z.B. ftp oder nfs
Kopieraktionen von vielen kleinen und auch einigen großen Dateien)
hinzunehmen, neben nmap und samba-Anmeldung.

Gleichzeitig würde ich mal untersuchen, ob der Rechner auch trapt wenn
du nicht-netzwerklastige Vorgänge ausführst, also wie vorgeschlagen
Kernel-Kompilieren (auch mit Streß), Kopieraktionen auf der/den Platten,
etc.

Wenn du dann feststellt, das die panic immer im Zusamenhang mit
Belastung der Netzwerk-Karte auftritt bist du doch schon einen großen
Schritt weiter.
Die Prioritäten der logischen Fehlersucheinkreismethode verschieben sich
doch dann gewaltig, die Notwendigkeit von Selbstkompilieren von
Programmen wird unwahrscheinlicher, das Austauschen der
Netzwerkkomponente wird wahrscheinlicher.

> > Evtl. ist es auch die Netzwerk-Karte. Ich denke, grad die Billigteile
> > können Probleme mit der Interrupt-Verteilung auf zwei CPUs haben.
> 
> /proc/pci sagt mir dass es eine
> MYSON Technology Inc SURECOM EP-320X-S 100/10M Ethernet PCI Adapter
> (rev0) ist. Ist das ein Billigteil?

Tut mir leid, der Hersteller sagt mir jetzt nichts, möchte auch nicht
googeln. Interessanter wäre der Chipsatz, also welches Modul geladen
wird. Wenn es ein OnBoard-NIC ist, dann ist es meiner Meinung nach ein
"Billigteil" wenn es nicht wenigstens ein Intel-Chip(eepro/eepro100)
oder 3Com ist. Das aber ohne Wertung, da kann dir jemand anderes
vielleicht besseres dazu sagen.
Nur: wenn du merken solltest daß die Traps im Zusammenhang mit der
Netzwerk-Traffic stehen würde ich auf jedenfall die Karte testweise
tauschen. Und bei einem Produktiv-Server würde ich auf Qualität achten.

> 
> Danke schonmal
> 
> Grüsse,
> 		Charlie

Gruß
	Gerhard



Reply to: