[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Thermische Probleme - Ist die Software schuld?



Andre Tann <atann@alphasrv.net> wrote:
> Am 04.06.2013 10:04, schrieb Martin Klaiber:

>> Wenn sich die Temperatur so schnell erhöht, ist in der Regel der
>> thermische Kontakt zwischen CPU und Kühlkörper schlecht. Hattest Du
>> den Kühlkörper mal abgenommen? Oft sitzt zwischen CPU und Kühlkörper
>> ein Wärmeleitpad, das nur einmal verwendet werden kann, da es sich
>> durch plastische Verformung an die Oberflächen anpasst.

> Ich hatte das Gerät bei einem Notebook-Schrauber, und der meinte, daß
> das nicht sinnvoll sei, diese Komponenten zu trennen, weil sie fest
> zusammen verbaut seien. Ich selbst laß da lieber die Finger von. Denn
> sonst funktioniert das Gerät gar nicht mehr ;)

Ack. War ein Missverständnis, sorry. Ich meinte nicht, dass Du den
Kühlkörper abnehmen sollst, sondern fragte, ob Du es irgendwann mal
gemacht hattest, das wäre dann nämlich eine mögliche Erklärung für
die Probleme.

>> Machbar ist das vielleicht, aber es wäre doch ziemlich sinnfrei. Du
>> denkst dabei an einen bug?

> Nee, im Gegenteil: Ich dachte, daß die Hardware dem OS sagt: Prozessor
> ist zu heiß, laß es mal ruhiger angehen. Wenn das OS dann aber nicht
> reagiert, sondern munter weiter rechnen läßt, dann wirds dem Prozessor
> eben zu heiß.

Ja, im Prinzip ist es so. Zum einen misst der Prozessor intern seine
Temperatur, die sollte das OS natürlich richtig auswerten. Zum anderen
hat der Prozessor tatsächlich spezielle Befehle, mit denen er eine
Not-Abschaltung oder ein Throttling veranlassen kann, wenn das OS bis
dahin nicht richtig reagiert hat. Auf diese Befehle kann das OS immer
noch reagieren und z.B. ein sauberes Herunterfahren veranlassen. Und
dann hat der Prozessor noch seine internen Schutzmechanismen, dabei
wird dann aber nichts mehr sauber heruntergefahren, das ist dann nur
noch ein Schutz gegen thermische Zerstörung.

> Mittlerweile denke ich aber, daß die Hardware auch bei völlig
> unkooperativem OS nicht überhitzen darf, jedenfalls...

Überhitzen schon, "abrauchen" sollte sie jedoch nicht. Was davon meinst
Du? Früher, bis etwa zum Pentium-II, konnte es tatsächlich passieren,
dass eine CPU "durchbrannte", wenn man sie ohne Kühlkörper betrieb oder
die Kühlung zu schlecht war. Das sollte heute nicht mehr möglich sein.

Überhitzen, im Sinne von "zu heiß werden" und "sich deshalb abschalten"
ist aber weiterhin möglich, wenn die Kühlung nicht ausreicht. Das wird
klar, wenn man sich verdeutlicht, wie klein das Die des Prozessors ist
und wie hoch die umgesetzte Leistung. Man stelle sich einfach vor, wie
heiß die Oberfläche einer Halogenlampe mit 50 Watt Leistung wird. Sie
dürfte etwa die Oberfläche eines CPU-Heatspreaders haben. Der Vergleich
passt zwar nicht ganz, aber man erkennt doch, dass das Problem nicht so
sehr die Leistung, sondern die kleine Fläche ist. Und die muss eben mit
dem Kühlkörper vergrößert werden. Klappt das nicht, wird es der CPU zu
heiß, selbst bei moderaten Leistungen. Ab etwa 150°C wird das Silizium
geschädigt, die Glühwendel einer Halogenlampe ist etwa 10 bis 20 Mal
heißer. Der Prozessor kann die Leistung über seine kleine Oberfläche
also gar nicht abführen, wenn er nicht überhitzen soll, und das geht
eben nur mit einem Kühlkörper. Wobei der Kühlkörper in der Praxis oft
gar nicht das Problem ist, sondern die Verbindung zwischen Kühlkörper
und CPU. Wenn diese Verbindung thermisch nicht gut ist, nützt der
größte Kühlkörper und der beste Lüfter nichts, weil sich die Hitze
trotzdem in der CPU staut und nicht zum Kühlkörper "abfließen" kann.

> ...nicht so schnell. Deswegen meine ich, daß die Kiste in der Tat
> einen Hardwareschaden, sprich: ein Kühlproblem hat.

Bevor Du die Kiste völlig abschreibst, kannst Du ja noch ein paar Tests
machen. Was sagt denn z.B. "acpitool -f -t"? Dreht der Lüfter? Ist er
enabled? Was steht bei der Temperatur unter Trip-Points critical? Das
ist die Temperatur, bei der der Rechner runterfährt (S5).

Du könntest auch mal manuell den Lüfter auf Maximaldrehzahl bringen
und dann nochmal Deinen Rechentest machen und schauen, ob er immer
noch aussteigt. Dazu Folgendes im Terminal eingeben (als root):

   echo "level full-speed" > /proc/acpi/ibm/fan

Dabei vielleicht mit acpitool -t die Temperatur beobachten. Zum
Abschalten des Lüfters dann wieder:

   echo "level auto" > /proc/acpi/ibm/fan

eingeben. Kann allerdings sein, dass die Verzeichnisse unter wheezy
inzwischen anders heißen.

> Danke für Deine ausführliche Erklärung!

Nichts zu danken. Ich will Dich auch nicht nerven, aber mich würde es
in den Fingern jucken, rauszufinden, was denn an der Kiste nicht stimmt
;-) Zumal der Kühlkörper ja fest zu sitzen scheint, der Lüfter dreht
und Du alles entstaubt hattest. Vielleicht doch ein Softwareproblem?

Ist denn das neueste BIOS drauf? Das wäre auch noch eine Fehlerquelle,
da sich das OS AFAIK die Infos für ACPI vom BIOS holt. Wobei es mit dem
BIOS ja schon mal funktioniert hatte, ist also auch unwahrscheinlich.

Gruß, Martin


Reply to: