[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Problema NFS travando.



Marcos Vinicius Lazarini, Luiz Gustavo  e turma,

Repasso os procedimentos que foram adotados e que iremos adotar e que podem ser útil para o histórico da lista.

Além de pesquisar alternativas, reportei este problema à vcs e obtive alguns posicionamentos sobre este ambiente relatando o seguinte:

1) A relação entre o N.I.S. (Networking Information Service) e do N.F.S.(Networking File System) é o calcanhar de Aquiles do ambiente de rede Linux.

2) Possivelmente é um problema associado à rede, uso e outros.

3) Verifiquei que o D.N.S. é fundamental para se ter uma rede e estes serviços funcionais e não temos um servidor secundário neste prédio, ficando sujeito as falhas e gargalos no link.

4) A configuração dos clientes NFS tem que ter uma opção de montagem "nolock". Pois na ocorrencia de não resolver o nome pelo D.N.S. trava o serviço NFS. Realizamos estas configurações.

Veja em :
http://libertas.pbh.gov.br/modules.php?name=FAQ&myfaq=yes&id_cat=7&categories=Problemas%2FSolu%E7%F5es+do+Libertas+3.x

5) O uso do N.I.S, se não for um servidor local ou não tiver configurado de acordo, gerada um tráfego absurdo quando se realiza qualquer comando como o ls(linux) para se listar os diretórios e arquivos(aqui são enormes). O tráfego enorme, se refere aos UID e GID que são Identificação de usuários e grupos para se verificar as permissões de acesso em cada objeto.

6) O problema de travamento do serviço do NFS/associados está ocorrendo, normalmente, quando há um grande volume de logons simultâneos/acesso ao correio/inicio de trabalho(de manhã/ à tarde). Pode ser coincidência, mas até agora é fato.

                                         Conclusão:

Em função dos itens 1 a 6 anteriores e por observação da mudança do ambiente pude diagnosticar inicialmente.


a) O nosso link já andava dando taxas de 800 bytes em alguns momentos;
b) É fundamental um servidor DNS local para evitar problemas de acesso remoto. c) O NIS é extremamente ineficiente e deve ser trocado pelo LDAP como feito nas escolas;
d) Enquanto o NIS não é substituído, devemos reavaliar a sua configuração;
e) Todos os mount´s de cliente´s devem ter a opção nolock;
f) O Problema que estamos passando em relação ao link, parece ter se agravado em função do servidor antigo ser um filtro as solicitações de acesso à rede pela baixa performance. O novo servidor, gera uma sobrecarga muito maior na rede por ter um troughput(produção) maior e com consequente solicitação à rede. g) Como este ambiente é complexo e sem documentação, pode ter faltado alguma configuração no servidor com o S.O. Debian e/outro e acho interessante o envolvimento de uma equipe multidisciplinar para tratarmos todos os pontos avaliados nesta conclusão. h) Capturar com um sniffer todo o tráfego de rede gerado com destino remoto entre o servidor de home e roteador para a RMI e determinar se não há tráfego e serviços desnecessários que possam comprometer todo o processo. i) Se não fizermos esta série de avaliações e ajustes, nada garante que um outro sistema operacional resolva o problema ou mesmo que este problema venha a se repetir nas 182 escolas de BH visto que: o ambiente e muito complexo e conforme item(f) principalmente.


Histórico da mudança:

Troca do servidor: 03/06/2005 as 21:30 hrs.
04 e 05 sábado/domingo -> Ok
06 ,07 e 08/06/2005 segunda, terça e quarta -> Ok
09/06/2005 quinta - travamento e reboot as 10:00 e 14:00 hrs.
10/06/2005 sexta - travamento e reboot as 9:30 e 13:00 hrs.
11 e 12/06/2005 - sábado e domigo -> Ok
13/06/2005 segunda - travamento e reboot as 9:15, 14:30 e 15.30 hrs.
14/06/2005 terça - travamento e reboot as 9:10, 14:15, 15.00 e 15:30 hrs.
15 e 16/06/2005 quarta - normal.

No dia 14/06/2005 as 17:00 hrs, efetuei os seguintes procedimentos:

1) Com relação ao item "b" da conclusão:

Conforme sugestão do Marcos Vinícus Lazarini instalei e configurei o pacote dnsmasq como cache.

Este pacote implementa um cache de DNS resolvendo os endereços para todos os clientes do libertas(cliente) e não realizando tráfego remoto.

2)  Com relação ao item "e" da conclusão:

Alteramos todos os mounts dos clientes Libertas colocando a opção "nolock".

3) No ambiente do novo servidor, alterei o número de processos NFSD (daemon) para 60.

Estes processos são responsáveis por atender a solicitação das máquinas clientes.

O Ambiente encontra-se em observação.

Um abraço e obrigado,

Gonzaga.



Reply to: