[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Machine Check Exception mit Kerneln > 2.6.18



Hallo,

ich habe hier einen Server (Supermicro Board X7DBE+, 16 GB RAM), der
seit Sep. 2007 relativ problemlos mit Etch (amd64) laeuft. Nun mussten
wir vom Kernel 2.6.18 zu einem aktuelleren wechseln, ich habe zuerst
den etch-n-half 2.6.24 und dann den 2.6.26 aus den backports
installiert. 

Seit dem bekomme ich taeglich eine Kernel Panic als Folge einer MCE.

HARDWARE ERROR
CPU 1: Machine Check Exception:   0 Bank 5: 1000001004000e0f
TSC 0
This is not a software problem!
Run through mcelog --ascii to decode and contact your hardware vendor
Kernel panic - not syncing: Machine check


mcelog habe ich eben erst installiert, ich warte noch auf die
naechste panic....

Sowohl der Lieferant des Servers, als auch ich haben den Speicher im
Sep. 2007 mit memtest mehrere Tage getestet, dabei war nichts
auffaellig.  Aktuell habe ich den Server mit der kernel Option
mem=2048M gebootet und er laeuft seit ~18h durch.

Der Lieferant meint, es muss nicht die Hardware (RAM) sein, sondern
auch ein fauler Treiber.

Wie kann ich die Ursache fuer die MCE am Besten finden? Das Problem
ist, dass der Server eigentlich im produktiven Betrieb ist. Und wieso
trat es mit 2.6.18 nicht auf?


Ralf




Reply to: