[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Serveur bloqué par de multiples CRON -f ?



> Le 16/03/17 à 11:27, Charles Plessy <plessy@debian.org> a écrit :
> CP> 
> CP> (Résumé des épisodes précédents, j'ai une machine virtuelle sur laquelle il
> CP> devient parfois impossible de se connecter.  Les sessions existantes continuent
> CP> de fonctionner normalement, une grande partie des logs ne sont plus écrits, et
> CP> un processus cron par heure se lance, semble bloquer et s'accumule.)

Le Fri, Mar 17, 2017 at 08:30:21AM +0100, Daniel Caillibaud a écrit :
> 
> Tu peux installer atop sur le host, et le régler avec une mesure par minute (10 par défaut,
> dans /etc/default/atop mettre `INTERVAL=60`), ça devrait te permettre après coup de voir à
> chaque minute l'état complet du host, par ex atop -r /var/log/atop/atop_YYYYmmdd -b hh:mm
> pour avoir un top amélioré de cette minute là, que tu peux trier par conso RAM, CPU, disque,
> etc. (man atop pour les détails).

Merci beaucoup pour la suggestion (et merci aussi à François pour sa
réponse); c'est assez formidable de pouvoir faire un « top » à rebours !

Nouveau plantage, mais cette fois-ci j'avais une fenêtre root ouverte.
Comme d'habitude, de nombreux processus « CRON -f » et impossibilité de
créer de nouvelles sessions (SSH, sudo, ...).  Cause ou conséquence,
cette fois-ci un démon gitlab-ci-multi-runner (source:
https://packages.gitlab.com/runner) accumulait des dizaines d'instances
(car il plantait naturellement suite à une différence de compatibilité
avec notre serveur local).  Je l'ai désinstallé, j'ai tué tous les
processus cron, j'ai relancé le service cron avec systemctl et j'ai
fini par un « systemctl reset-failed ».  Je peux de nouveau me connecter
à la machine sans avoir eu besoin de la redémarrer.

Un inspection avec atop de l'état de la machine au moment ou elle a
cessé d'enregistrer ses logs (sauf -- MARK --) ne montre rien de
spécial...  Mais ceci dit merci encore de m'avoir fait apprendre atop.

Je ne comprends toujours pas ce qui peut empêcher la machine de créer de
nouvelles sessions alors qu'il y a assez de mémoire, d'espace disque et
de temps processeur...

Bonne journée,

Charles

-- 
Charles Plessy
Tsurumi, Kanagawa, Japon


Reply to: