samba+lustre периодическое зависание
hi, уважаемые All.
хотелось бы услышать отзывы об успешной/неуспешной реализации именно под
ленни с указанием ориентировочной нагрузки.
из личного опыта: столкнулся с периодическим уходом клиента кластера в
глубокий даун, на котором собственно и крутится самба с расшареными 25
ТБ мультимедиа. Выход из дауна только резетом. Средняя нагрузка на самбу
2 ТБ в сутки. Железо на машине серверное:
мать Intel® Server Board S5000VSA,
процы 2 х Intel Xeon 5310 Quad-Core 1.60 GHz,
сеть Intel 82571EB PRO/1000 AT Quad Port Bypass Adapter,
ядро с репозитария pdsi-scidac.org 2.6.22.19-lustre-amd64,
самосборный только модуль сетевого интерфейса е1000е.
уход в даун начинается с увеличения LA (график заббикса прилагаю),
периодичность подобной ситуации за 3 месяца работы - 3 раза. Наставьте
на путь истинный как диагностировать проблему? Гугление полезного ничего
не дало.
Из предполагаемых причин
1. DOS самбы (т.к. при увеличении LA растет количество smb процессов и
отрытых сокетов раза в четыре).
2. глючность железа (но перед этим на нем работала Фря с SCSI массивом
и, примерно, такой же нагрузкой)
3. глючность ядра именно в паре с самбой (рядом на пяти нодах кластера
стоит то же самое без самбы и полет нормальный)
4. кривизна собственных рук в отношении настройки самбы для работы в
кластере.
спасибо всем откликнувшимся.
с ув.Сергей
Reply to: