[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OFF-TOPIC] Ferramenta para teste de CPU



Em Mon, Dec 14, 2009 at 07:42:21PM -0200, Edson Marquezani Filho escreveu:
| Estou enfrentando uns problemas com servidores HP DL380 G5 em um rede,
| e ainda não consegui isolar a causa. Porém, uma das hipóteses é falha
| de hardware, uma que vez que os dois sofreram uma certa agressão
| recentemente.
| 
| O sintoma aparente é que os servidores travam por pequenos instantes,
| a todo momento. Tenho tido algumas evidências de que o problema é
| relacionado ao hardware mesmo, inclusive essas mensagens de log do
| kernel:
| 
| Dec 14 10:09:16 slave kernel: BUG: soft lockup - CPU#4 stuck for 12s!
| [kipmi1:4501]
| Dec 14 12:27:56 slave kernel: BUG: soft lockup - CPU#7 stuck for 14s!
| [kipmi1:4501]
| Dec 14 13:50:54 slave kernel: BUG: soft lockup - CPU#6 stuck for 15s!
| [kipmi1:4501]
| Dec 14 13:50:55 slave kernel: BUG: soft lockup - CPU#1 stuck for 10s!
| [swapper:0]
| Dec 14 13:56:38 slave kernel: BUG: soft lockup - CPU#6 stuck for 14s!
| [kipmi1:4501]
| Dec 14 14:06:26 slave kernel: BUG: soft lockup - CPU#3 stuck for 10s!
| [kipmi1:4501]
| Dec 14 14:18:06 slave kernel: BUG: soft lockup - CPU#6 stuck for 12s!
| [kipmi1:4501]
| Dec 14 15:22:07 slave kernel: BUG: soft lockup - CPU#3 stuck for 20s!
| [kipmi1:4501]
| Dec 14 15:22:08 slave kernel: BUG: soft lockup - CPU#1 stuck for 19s!
| [swapper:0]
| Dec 14 18:31:36 slave kernel: BUG: soft lockup - CPU#3 stuck for 20s!
| [dlm_send:3864]
| Dec 14 18:31:36 slave kernel: BUG: soft lockup - CPU#7 stuck for 20s!
| [kipmi1:4501]
| 
| Algum de vocês pode me sugerir uma ferramenta pra rodar testes de CPU,
| e ver se realmente estou com problemas? Ficaria muito grato.
| 
| Obrigado.
| 
| Obs: esses sistemas não são Debian, por isso o OFF-TOPIC.

Oi Edson,

O cpuburn testa a CPU, mas...

Na página do cpuburn [0] tem um aviso interessante:
----------------------------------------------------------
*** WARNING *** This program is designed to heavily load CPU chips.
Undercooled, overclocked or otherwise weak systems may fail causing data
loss (filesystem corruption) and possibly permanent damage to electronic
components. Nor will it catch all flaws.

*** USE AT YOUR OWN RISK *** 
----------------------------------------------------------

Porém, procurando pela mensagem de erro, cheguei na thread [1], Acho que 
vale a pena dar uma olhada nela. Qual versão do teu kernel ?


[0] http://pages.sbcglobal.net/redelm/
[1] http://kerneltrap.org/mailarchive/linux-kernel/2007/12/7/493907

Att,

LEslie


Reply to: