Приветы. Столкнулся с проблемой: После vzdump, несостоявшегося, "замерли" все процессы внутри одного VE. Все остальные (порядка 20 штук) продолжили работать как надо. vzctcl stop <VEID> отвечает "Unable to stop VE: operation timed out" На restart и stop --fast сообщает тоже самое. vzctl exec/exec2 reboot и poferoff ни к чему не приводят (просто "проглатываются строки) vzctl enter молча переходит на другую строку, не давая зайти внутрь VE и не сообщая каких-либо ошибок. Попытка сделать kill -TERM/-KILL/-HUP на любой из "замерзших" процессов (в т.ч. на init от VE) не дает ничего - процесс остается жить без каких либо записей в логи, ошибок и смены состояния (например zombie) Попытка отмонтировать все ФС из proc, связанные с этим VE и удалить квоту ни к чему не привели. Восстановился из недельного бэкапа с другим VEID, предварительно сделав --ipdel для IP-адресов, которые используются этим VE. В dmesg ничего интересного на эту тему. NSF и mount --bind не используются. # uname -a Linux earth 2.6.18-ovz-028stab048.1 #1 Thu Nov 1 19:49:27 CET 2007 i686 GNU/Linux # vzctl --version vzctl version 3.0.22-1dso1 Пакеты с OpenVZ-ядром и vzctl (и всеми vz-тулсами) поставленны с http://debian.systs.org/ Если надо еще какую-то другую информацию предоставить - скажите пожалуйста какую. В гугле натыкался на какой-то древний баг 2006 года, но решения так и не нашел. Нода работала ~месяц без ребутов и до этого ~ полгода. Заранее спасибо за любую информацию о решении проблемы. Т.к. ноду не перезагружал, "замерзший" VE так и висит в vzlist, но ни на что не отвечает. На ноде и внутри VE стоит debian etch. -- Best regards, Mikhail
Attachment:
signature.asc
Description: This is a digitally signed message part.