[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: como descobrir/detectar problemas de hardware em gnu/linux



Marcio de Araujo Benedito wrote:

Gente; essa tá me deixando virado na peste!!!

Tenho uma máquina com uns 3 anos de uso continuo, quando era nova usava
como servidor de desenvolvimento, ficando a maioria do tempo ligada 24x7
salvo alguma faxineira desavisada que puxava a tomada a noite. Depois
peguei esta máquina para usar como desktop, mas de uns tempos para cá
ela está apresentando um comportamento estranho.

Inicialmente começou a dar erros no filesystem ext3, sendo que o sistema
era remontado direto como somente leitura, e após os reboots passava o
fsck e apresentava uma série de erros de inodes duplicados e informações
não utilizadas/reconhecidas no disco. Após formatar e instalar tudo de
novo sem resolver o problema, troquei o HD, pois é o suspeito nº 1
segundo minhas buscas no google.

Instalei o novo HD sem aproveitar nada da instalação antiga, e passados
um mes a máquina apresentou o mesmo comportamento, dando corrupção de
filesystem ext3 a ponto dos programas começarem a não funcionar, por
falta de alguma lib perdida durante um dos muitos fsck.

Troquei novamente o HD, e a mesma lereia.

Quando fui pedir mais um HD o pessoal da manutenção rui da minha cara e
disse que os dois HDs que eles tiraram da minha máquina estavam
funcionando, e já tinham até sido instalados em outras máquinas com
windows e estavam em produção nos desktops. Quando descrevi o problema
me disseram que poderia ser algum outro hardware com defeito que estaria
causando a corrupção de filesystem, e me deram um monte de diskete de
diagnostico para testar, todos para windows, e segundo o pessoal eles
testam até os parafusos da máquina.

Além de eu já ter mandado minha licença de windows para as cucuias ha muito,
não vou instalar só para testar o hardware. ENtão pergunto: Como
persegur o hardware trapalhão? Quais programas para gnu/linux eu posso
usar para diagnosticar a máquina?

Ou existe outra forma de verificar o que pode estar dando problema, sem
ser na base do tentativa e erro?????

Márcio, os programas que eu conheco que fazem teste e diagnóstico no linux são:

memtest86+ -> teste de memória RAM

dd_rescue -> faz a leitura do HD (meio que exame de superfície)

Análise do /var/log/*.log, em conjunto com algum aplicativo rodando

O linux tipicamente lida bem com HW mais porcarias, mas se o defeito por esporádico, fica dificil... O que pode ter acontecido é que alguma versão de kernel mais nova introduziu algum bug relacionado ao seu HW - já tive um micro com placa mae SIS que reconhecia parcialmente a ethernet onboard, nem por decreto funcionava! E isso ocorreu do 2.6.5 ao 2.6.7, mais ou menos. Fora dessa faixa de kernel, ia tudo perfeito.

Em manutenção, o que a gente vai fazendo é tentar isolar o defeito - mudando uma coisa de cada vez, até achar alguma coisa (conclusiva) relacionada ao defeito. No seu caso, não é muito simples, mas nao vejo outra opcao... uma vez que o disco foi corrompido, o defeito nao precisa mais se manifestar.
E se voce ficasse usando a máquina via LiveCD?

--
Marcos



Reply to: