[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: systemd в jessie умирает с SIGFPE



Руслан Коротаев <korotaev@ufamail.ru> writes:

> В сообщении от [Сб 2015-09-12 16:37 +0300]
> Yuriy M. Kaminskiy <yumkam@gmail.com> пишет:
>
>> Я только что нарвался на неприятный баг: на попытке перезапустить (не
>> полностью стартовавший) сервис, systemd помер с SIGFPE на целочисленном
>> делении на 0 (точнее, намерено завис в обработчике сигнала). При этом
>> systemd не реагирует ни на что [systemctl, kill -INT 1, и т.д.], не
>> подбирает zombie, систему можно перезапустить только вручную (убив
>> процессы и перемонтировав fs в read-only; ну, или через
>> alt-sysrq-e-u-s-b; halt/reboot, естественно, не работают), и.т.д.
>> 
>> Я нашёл идентичный баг в багтрекире - 
>> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=774012
>> но он помечен как fixed и archived. Хотя, очевидно, в jessie он
>> присутствует и *не* исправлен. Что с этим можно сделать (и можно ли)?
>
> Для повышение надежности системы, в systemd есть функциональность
> сторожевых таймеров (watchdog [1]). В случае возникновения проблем,
> systemd пытается привести систему в рабочее состояние, путем перезапуска
> отдельных сервисов или системы целиком. Здесь об этом подробнее [2].
>
> [1] https://ru.wikipedia.org/wiki/Сторожевой_таймер;
> [2] http://0pointer.de/blog/projects/watchdog.html

Проблема только в том, что в данном случае помер/завис сам
systemd (pid=1). Перезапускать его некому.


Reply to: