[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Grund vuer Serverabstuerze herausfinden



On Mo, Aug 25, 2014 at 10:58:32 +0200, Christoph Schmees wrote:
>Am 24.08.2014 21:22, schrieb Christian Schoepplein:
>> ...
>> - Was fallen euch noch für Möglichkeiten ein, wie ich der Absturzursache 
>> auf die Schliche kommen könnte?
>>
>
>was du schreibst, klingt schwer nach HW: Netzteil oder das Board
>selber.

Ja, ich befürchte sowas ja auch schon :-(.

Ich habe jetzt mal den syslog so umgestellt, dass er auf eine andere 
Maschine im Netz logged, hab hier noch einen ipfire laufen, den kann ich 
dafür verwenden.

Danke auch für das Entfernen des Bretts vormKopf bzgl. der Verbindung 
auf eine Console über USB, darauf, dass man das mit zwei 
USB-Serial-Adaptern machen kann, bin ich nach dem Absenden meiner Mail 
auch irgendwann gekommen :-).

>Als Test würde ich auf der Maschine einen Kernel
>kompilieren, und zwar mit der -j Option. Ja, ohne Parameter,
>damit maximale Parallelisierung erfolgt. Da trennt sich die Spreu
>vom Weizen.

Das läuft gerade hier und die Maschine lässt sich noch pingen, mehr geht 
aber nicht mehr :-(. An den Syslog-Einträgen, die ja jetzt remote 
geschrieben werden, kann ich sehen, dass der Kiste wohl ab und an der 
Speicher ausgeht:

Aug 25 14:47:14 192.168.1.1 srv kernel: [    0.000000] Memory: 
7839240K/8045020K available (4957K kernel code, 747K rwdata, 1724K 
rodata, 1008K init, 960K bss, 205780K reserved)
...
Aug 25 19:57:08 192.168.1.1 srv kernel: [13681.651129] Out of memory: 
Kill process 15814 (cc1) score 1 or sacrifice child
Aug 25 19:57:08 192.168.1.1 srv kernel: [13681.651162] Killed process 
15814 (cc1) total-vm:100400kB, anon-rss:3300kB, file-rss:2300kB
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674504] [13623]     0 
13623     2433        0       9       45             0 gcc
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674506] [13624]     0 
13624     1080       10       7       32             0 sh
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674507] [13626]     0 
13626     2433        0       9       46             0 gcc
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674508] [13627]     0 
13627     2433        0       9       45             0 gcc
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674509] [13628]     0 
13628     2433        0       9       45             0 gcc
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674510] [13629]     0 
13629    13826     1196      30     2494             0 cc1
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674512] [13630]     0 
13630     5387       20      16     1355             0 as
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674513] [13631]     0 
13631    14944     1436      31     3172             0 cc1
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674514] [13632]     0 
13632     5387       20      16     1356             0 as
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674516] [13633]     0 
13633    16025     2114      34     3678             0 cc1
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674517] [13634]     0 
13634     5387       20      15     1355             0 as
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674518] [13636]     0 
13636     2433        0       9       46             0 gcc
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674520] [13637]     0 
13637    14424     1643      31     2546             0 cc1
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674521] [13638]     0 
13638    16570     1290      34     5245             0 cc1
Aug 25 19:57:08 192.168.1.1 srv kernel: [14306.674522] [13639]     0 
13639     5387       20      15     1356             0 as
Aug 25 19:57:09 192.168.1.1 srv kernel: [14306.674523] [13640]     0 
13640     2433        0       9       46             0 gcc
Aug 25 19:57:09 192.168.1.1 srv kernel: [14306.674525] [13641]     0 
13641    18263      763      37     7204             0 cc1
Aug 25 19:57:09 192.168.1.1 srv kernel: [14306.674526] [13642]     0 
13642     2433        0      10       45             0 gcc
Aug 25 19:57:09 192.168.1.1 srv kernel: [14306.674527] [13643]     0 
13643    14386     1598      31     2774             0 cc1
Aug 25 19:57:09 192.168.1.1 srv kernel: [14306.674528] [13644]     0 
13644    15962     1968      34     3741             0 cc1
Aug 25 19:57:09 192.168.1.1 srv kernel: [14306.674529] [13647]     0 
13647    15554      942      33     4220             0 cc1
...

Keine Ahnung, ob das Ganze irgendwann noch fertig wird, das Compilieren 
dauert nun schon mehrere Stunden.

Einen Eintrag, dass der Speicher knapp wird oder ausgeht, habe ich noch 
nie im syslog gesehen, glaube eigentlich nicht, dass das die Ursache für 
die ständigen Abstürze ist, das kommt jetzt nur von der Compiliererei.

Soll ich das Ganze abbrechen oder es durchlaufen lassen? Wie könnte ich 
nun weitermachen um evtl. die Ursache noch zu finden?

Ciao und thx,

  Christian

Attachment: signature.asc
Description: Digital signature


Reply to: