[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Problemas com o kernel 2.6.18 do etch



Amigos,

Desde que migrei meu super router 486 do sarge p/ o etch, minhas dores
de cabeça aumentaram infinitamente... pois antes eram zero, e agora
são muitas.

Primeiro, a máquina fica super lerda quando estou transferindo em
'altas velocidades'; coisas como mais de 100kb/s - ai o load average
da máquina dispara... uma hora, quando observei estava em mais de 25!!
Obviamente, com uma carga dessa, o sistema congela (inclusive meu
processo de cache de dns). O estranho era que quem tovama todo esse
tempo era o kernel, pois o roteamento funcionava bem mas nenhum outro
processo conseguia rodar.
Quando a transmissão parava, rapidamente tudo voltava ao normal....


Outra coisa: de vez em quando aparece isso na minha tela e no meu dmesg:

BUG: soft lockup detected on CPU#0!
[<c011290c>] update_process_times+0x34/0x5a
[<c01047ed>] timer_interrupt+0x20/0x3b
[<c011f324>] handle_IRQ_event+0x21/0x49
[<c011f3a6>] __do_IRQ+0x5a/0xa0
[<c010398b>] do_IRQ+0x3a/0x47
[<c01024ea>] common_interrupt+0x1a/0x20
[<c01e007b>] .text.lock.bus+0x11/0x42
[<c01e8375>] ne_block_input+0xaf/0xe2
[<c01e8a58>] ei_receive+0x1f3/0x2a4
[<c0103990>] do_IRQ+0x3f/0x47
[<c01e91cf>] ei_interrupt+0x14e/0x267
[<c011f324>] handle_IRQ_event+0x21/0x49
[<c011f3a6>] __do_IRQ+0x5a/0xa0
[<c010398b>] do_IRQ+0x3a/0x47
[<c01024ea>] common_interrupt+0x1a/0x20
[<c01e007b>] .text.lock.bus+0x11/0x42
[<c01e846d>] ne_block_output+0xc5/0x127
[<c01e8fd5>] ei_start_xmit+0x177/0x223
[<c020b08d>] kfree_skbmem+0x63/0x67
[<c026e216>] packet_rcv_spkt+0xfc/0x106
[<c020f234>] dev_hard_start_xmit+0xcd/0x1a9
[<c0218060>] __qdisc_run+0x9c/0x113
[<c0210742>] dev_queue_xmit+0xe3/0x1ad
[<c02369ef>] ip_output+0x192/0x1c7
[<c02334c5>] ip_forward+0x1c6/0x201
[<c0232512>] ip_rcv+0x393/0x3bd
[<c020f05b>] netif_receive_skb+0x12e/0x16f
[<c021049a>] process_backlog+0x6c/0xd5
[<c0210555>] net_rx_action+0x52/0xcd
[<c010f28c>] __do_softirq+0x34/0x75
[<c010f2ef>] do_softirq+0x22/0x26
[<c010f48e>] local_bh_enable+0x60/0x6b
[<c022e98e>] rt_garbage_collect+0x14a/0x216
[<c0211b1a>] dst_alloc+0x18/0x7e
[<c022fa35>] __ip_route_output_key+0x4e1/0x6c8
[<c022fc37>] ip_route_output_flow+0x1b/0x67
[<c0249d85>] ip4_datagram_connect+0x1b1/0x2a8
[<c02071d8>] sys_connect+0x68/0x95
[<c02074e5>] sock_attach_fd+0x6c/0xcc
[<c0137437>] get_empty_filp+0x4b/0xc8
[<c02077bc>] sock_map_fd+0x40/0x48
[<c0207f75>] sys_socketcall+0x7a/0x17e
[<c01022a7>] syscall_call+0x7/0xb


Esse softlockup vem de uma opção que liguei no kernel (vale lembrar
que isso já estava ligado no kernel desde o woody e nunca tive
problemas assim):

CONFIG_DETECT_SOFTLOCKUP:
Say Y here to enable the kernel to detect "soft lockups",
which are bugs that cause the kernel to loop in kernel
mode for more than 10 seconds, without giving other tasks a
chance to run.
When a soft-lockup is detected, the kernel will print the
current stack trace (which you should report), but the
system will stay locked up. This feature has negligible
overhead.
(Note that "hard lockups" are separate type of bugs that
can be detected via the NMI-watchdog, on platforms that
support it.)


Em outras palavras, fiquei decepcionado com o etch, e estou escrevendo
p/ registrar aqui os fatos. Gostaria de saber se alguém tbm teve
problemas semelhantes, e quem sabe, bolou alguma idéia p/ contornar o
problema... realmente está bem chato isso aqui.


--
Marcos



Reply to: