непонятные проблемы
История проблемы:
У одного из западных провайдеров был куплен колокейшн вместе с машинкой.
Провайдер сам водрузил туда woody.
Этот woody сразу был сапгрейжен до testing.
Проблемы начались практически сразу. Машинка висла сама, программы падали с сегфаултом,
ядро компилилось через раз.
Провайдер заменил ВСЕ железо кроме жесткого диска (как они утверждают).
Однако больше 2-х суток машинка все-равно не живет и в dmesg сообщения вот такого рода.
Unable to handle kernel NULL pointer dereference at virtual address 00000000
printing eip:
c01403b8
*pde = 00000000
Oops: 0000
CPU: 0
EIP: 0010:[d_lookup+92/244] Not tainted
EFLAGS: 00010203
eax: c1ffe650 ebx: fffffff0 ecx: 00000011 edx: 135346f6
esi: 00000000 edi: dfb63fa4 ebp: 00000000 esp: dfb63f14
ds: 0018 es: 0018 ss: 0018
Process spamd (pid: 4949, stackpage=dfb63000)
Stack: dfb63f74 00000000 dfb63fa4 f6829b80 c1ffe650 f081e005 135346f6 00000005
c0138192 f6aa69e0 dfb63f74 dfb63f74 c0138531 f6aa69e0 dfb63f74 00000004
f081e000 00000000 dfb63fa4 00000009 c0137fae 00000009 f081e00b 00000000
Call Trace: [cached_lookup+14/80] [link_path_walk+457/1720] [getname+94/156] [path_walk+26/28] [__user_walk+53/80]
[sys_stat64+25/112] [sys_open+104/148] [system_call+51/56]
Code: 8b 6d 00 8b 54 24 18 39 53 44 75 74 8b 44 24 24 39 43 0c 75
<1>Unable to handle kernel NULL pointer dereference at virtual address 00000008
printing eip:
c012f74b
*pde = 00000000
Oops: 0000
CPU: 0
EIP: 0010:[dentry_open+51/388] Not tainted
EFLAGS: 00010202
eax: f13f1001 ebx: ec6e2270 ecx: 00000000 edx: 00000000
esi: f13f1000 edi: 4004dd14 ebp: bffff6b8 esp: dd995f88
ds: 0018 es: 0018 ss: 0018
Process apache (pid: 13087, stackpage=dd995000)
Stack: 0000000b efdf6740 c1e0f2d0 4004dd14 bffff6b8 00000000 00000001 00000001
c012fa37 f13f1000 00008000 00000000 dd994000 00008000 c0106d7b 08c11048
00008000 00000000 00008000 4004dd14 bffff6b8 00000005 0000002b 0000002b
Call Trace: [sys_open+51/148] [system_call+51/56]
Code: 8b 72 08 a8 02 74 13 56 e8 b4 89 00 00 89 c7 83 c4 04 85 ff
Отключение swap делу не помогло. Хотя теперь сообщения несколько другие, чем было до замены железа.
Там в основном были сообщения типа kernel BUG in tralala.c:xxx.
Ядра применялись и скомпиленные под эту машинку и из дистрибутива (2.4.18-bf2.4). Эффект один и тот же.
Компиляция ядра проходит через раз. Причем чем дольше машинка работает, тем меньше шансов что ядро соберется.
Абсолютно точно ядро не собирается если параллельно запустить что-то типа dd if=/dev/sda1 of=/dev/null.
Что можете посоветовать? Я уже устал придумывать :)
--
Nick Potemkin
Eniro Rus-M
http://www.eniro-m.ru
::: Yellow Pages Moscow
http://www.yellowpages.ru
phone: +7 (095) 799-55-55
fax: +7 (095) 799-55-09
Reply to: