[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Server hängt beim Booten, warum auch immer :_(



On Mon, 7 Nov 2011 12:00:07 +0100, Christian Schoepplein wrote:
Hallo Daniel,

danke erstmal für deine Antwort...

On Mo, Nov 07, 2011 at 10:18:58 +0100, Daniel Pirs wrote:
On Mon, 7 Nov 2011 09:20:33 +0100, Christian Schoepplein wrote:
hier hängt sich ein Server beim Booten immer direkt weg, nachdem GRUB
durchgelaufen ist. Auf dem Bildschirm ist Folgendes zu sehen, womit
ich
aber leider nicht wirklich was anfangen kann :-(:

mount: mounting none on /dev failed: No such device
W: devtmpfs not available, falling back to tmpfs for /dev
INIT: version 2.88 booting
Using makefile-style concurrent boot in runlevel S.
Starting the hotplug events dispatcher: udevd.
Synthesizing the initial hotplug events...done.
Waiting for /dev to be fully populated...[    4.464497] power_meter
ACPI000D:00:
Ignoring unsafe software power cap!
done.


So wie sich das liest ist entweder einer deiner Sensoren beschädigt
und liefert
falsche Werte, oder du hast einen Server mit redundanten Netzteilen
und eines davon fehlt.
Lässt sich auf HP Servern gut beobachten.

Was hast du denn für Hardware?

Es ist wirklich eine Kiste von HP, genauer ein ProLiant DL380 G7. Ich
kenne die Möglichkeit mit hpasmcli allemöglichen Werte abzufragen, hab
ich auch grad mal gemacht, es sieht aber nichts verdächtig aus.

Auf der Kiste ist Debian Squeeze installiert, allerdings ist das System
von Debian 5.x upgedatet worden. Letzte Woche bootete die Kiste och
ordentlich, dann kam irgendwann eine Fehlermeldung, dass das Modul
pcspkr schon registerit sei (die genaue Meldung hab ich leider
nichtmehr), jedenfalls wars auch was mit udev. Ich habe daraufhin
gegoogelt, einen Bugreport gefunden und alsa-utils installiert und
daraufhin das pcspkr-Modul geblacklistet, seitdem war der erste Fehler
verschwunden, jetzt kommt aber halt der oben gepostete.


Hättest du ggf. die Möglichkeit die Kiste neu aufzusetzen? Nach dem letzten Update auf meinem Notebook tauchten auch plötzlich ACPI-Fehler auf (ja ich weiss laptop-mode ist nicht immer perfekt, aber vorher gings doch auch...)

Da wir die Kiste als Webserver verwenden möchten, läuft ein
openvz-Kernel (2.6.32-5-openvz-686). Soweit funktioniert openvz auch,
allerdings verliert ein Netzwerkinterface, das direkt von außen auf
einen openvz-Container zeigt, ab und an mal die Verbindung, kommt dann
wieder, ist wieder weg, usw. Auch das ist für mich nicht wirklich
erklärbar, in den Logs findet man keinen Fehler, nichts, deshalb geht
meine Vermutung jetzt langsam auch immermehr dahin, dass die Hardware
irgendwie defekt ist.


Das ist nicht auszuschließen, hatte ich auch vor kurzem, allerdings auf
einem ML350 G5. Ein defektes RAM-Modul hat da "alle Nase lang" mal Module
die schon geladen waren verschwinden lassen.

Hast du weitere Ideen, wie ich an Infos und den aktuellen Satus der
Hardware komme? Der Server steht im Rechenzentrum, da müsste ich erstmal hin, daher wäre es mir am liebsten, ich könnte hier vom Büro aus erstmal
so viele Infos bekommen, wie möglich.


Hast du eine Remote Hand vor Ort? Wenn ja, dann lass den mal zum Server laufen und schauen was das Frontpanel anzeigt. Ebenfalls könntest du iLO nutzen sofern wie es angeschlossen und konfiguriert wurde.

Ciao und danke,

  Schöpp

Ciao,

Daniel


Reply to: