[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Trouver ce qui bloque temporairement une machine



Bonjour,

je suis confronté à un problème étrange.

J'ai un serveur du genre "costaud" (bi Xeon 2,4Ghz, 2Go de RAM, avec des
disques RAID, enfin un gros truc). Il n'est pas chargé (0.1 de load en
moyenne), bien qu'il fasse plein de trucs (c'est un serveur Big Brother
[cf bb4.com] qui surveille 400 autres serveurs).

Hors, j'ai des bloquages parfois aléatoires, parfois réguliers.

Du genre :

1/ j'édite un petit fichier (avec vi), l'enregistrement est _long_. La
machine semble geler une seconde ou deux, puis ça repart. Bien sûr,
comme c'est à distance et que c'est aléatoire, je ne peux pas être sûr
que ce n'est pas juste l'affichage (via ssh) qui bloque. Mais il se
trouve que c'est toujours au moment d'enregistrer.

2/ Le moniteur Big Brother fait des tests réseau. Il a parfois du mal à
résoudre les noms, les tests échouent par timeout, à leur début ou en
cours (chargement d'une image avec libcurl). Les serveurs testés à
problème sont grosso-modo toujours les mêmes.


C'est une Debian 3.0 avec un noyau 2.4.20 SMP, la carte réseau est une
Intel (e1000: eth0 NIC Link is Up 100 Mbps Full Duplex), la carte SCSI
est une Adaptec AIC-7899.


Alors, ce que je cherche, c'est soit une piste sur où commencer à
chercher, soit un outil ou une technique permettant de diagnostiquer un
peu n'importe quoi. Je suis un peu paumé, je sais pas par où commencer.
Le "BSD process accounting" peut-il m'être utile, par exemple ?

Merci d'avance pour vos réponses, idées...


-- 
Charles



Reply to: