[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Unable to stop VE: operation timed out (openvz на debian etch)



Приветы.

Столкнулся с проблемой:
После vzdump, несостоявшегося, "замерли" все процессы внутри одного VE.
Все остальные (порядка 20 штук) продолжили работать как надо.
vzctcl stop <VEID> отвечает "Unable to stop VE: operation timed out"
На restart и stop --fast сообщает тоже самое.
vzctl exec/exec2 reboot и poferoff ни к чему не приводят (просто "проглатываются
строки) vzctl enter молча переходит на другую строку, не давая зайти внутрь VE
и не сообщая каких-либо ошибок. Попытка сделать  kill -TERM/-KILL/-HUP на любой
из "замерзших" процессов (в т.ч. на init от VE) не дает ничего - процесс остается
жить без каких либо записей в логи, ошибок и смены состояния (например zombie)
Попытка отмонтировать все ФС из proc, связанные с этим VE и удалить квоту ни к
чему не привели. Восстановился из недельного бэкапа с другим VEID,
предварительно сделав --ipdel для IP-адресов, которые используются этим VE.
В dmesg ничего интересного на эту тему. NSF и mount --bind не используются.

# uname -a
Linux earth 2.6.18-ovz-028stab048.1 #1 Thu Nov 1 19:49:27 CET 2007 i686 GNU/Linux
# vzctl --version
vzctl version 3.0.22-1dso1

Пакеты с OpenVZ-ядром и vzctl (и всеми vz-тулсами) поставленны с
http://debian.systs.org/ Если надо еще какую-то другую информацию
предоставить - скажите пожалуйста какую.
В гугле натыкался на какой-то древний баг 2006 года, но решения так и не нашел.
Нода работала ~месяц без ребутов и до этого ~ полгода.
Заранее спасибо за любую информацию о решении проблемы.
Т.к. ноду не перезагружал, "замерзший" VE так и висит в vzlist, но ни на что не отвечает.
На ноде и внутри VE стоит debian etch.

-- 
Best regards,
         Mikhail

Attachment: signature.asc
Description: This is a digitally signed message part.


Reply to: