[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Снова о ZFS




07.01.2018 21:58, Sergey Matveev пишет:
> *** artiom [2018-01-07 21:18]:
>> - Какой ZRAID лучше использовать: ZRAID2 или достаточно ZRAID?
> 
> Зависит от количества и размера дисков в массиве, режимов
> работы/нагрузки на них, в случае с ZFS ещё и recordsize. Почему появился
> RAIDZ2 (или RAID6)? Потому-что размеры дисков растут быстрее чем их
> скорость работы. Если в массиве RAID5/RAIDZ вылетает диск, но всё
> начинает rebuild-ится, находится под бешенной нагрузкой. С маленькими
> размерами диска rebuild занимает вменяемое время. С большими дисками
> может занимать дни/неделю. Так как диски в основном ставят более-менее
> из одной партии, то вероятность что ещё кто-то кокнется из этих же
> дисков -- высока. А когда они ещё и под бешеной нагрузкой -- ещё выше.
По-идее, у меня диски должны быть по две группы из разных партий (по 2
от разных поставщиков и в разное время заказаны).
Понятно, что от указанной проблемы это не сильно спасёт, лишь уменьшит
вероятность.
Хотя, я пересмотрел: я же не могу сделать RAIDZ2 менее, чем с 6-ю
дисками, а у меня их только 4.

> Отсюда и появились RAID6/RAIDZ2 где два диска могут вылететь и ничего
> плохого не случится. RAIDZ3 -- аналогичное продолжение, где уже три
> диска. В ZFS с RAIDZ ещё добавляются вопросы по эффективности
> использования места. В некоторых конфигурациях можно с ним потерять
> половину места. Советую вот эту статью посмотреть:
> https://www.delphix.com/blog/delphix-engineering/zfs-raidz-stripe-width-or-how-i-learned-stop-worrying-and-love-raidz
> И не забывать что можно/стоит использовать не один RAIDZ массив, а
> stripe из нескольких.
> 
3-й - не мой вариант. Слишком велика избыточность, при малой вероятности
события, от которого он защищает (плюс, возможно использование
дополнительных резервных копий). Страйп - тоже сомнительный вариант,
хотя я и думаю про него: дисков-то у меня от 4-х до 8-ми.
Статью почитал.
Вроде немного, но я так полагаю, что оптимальное решение - просто
сделать пул RAIDZ из 4-х дисков (и по скорости будет нормально, и
избыточность не 33%, а 25%) и не париться.

Не вполне понятно другое: 'To double your read IOPS, you would need to
halve the number of "data" disks in the RAID-Z group (e.g. with RAIDZ-2,
go from 12 to 7 disks).'

Они же не хотят сказать, что при использовании RAIDZ на четырёх дисках,
производительность упадёт в четыре раза, по отношению к одному диску?

>> - Имеет ли смысл включать сжатие (в приведённой выше конфигурации)?
> 
> Практически всегда не имеет смысла не включать его (compression=lz4).
> Если заранее известно что там будет только плохосжимаемые данные, то да,
> можно отключить. LZ4 безумно быстрая штука, которая хорошо понимает что
> ей суют несжимаемые данные и она оставит их "как есть" -- не будет
> overhead-а как от сжатия. Сжатие тут как-правило только ускорит всё: так
> как данных между дисков и системой надо просасывать меньше. Ну и просто
> приятно видеть как du для MongoDB может показать 20 GB, хотя реально в
> ней данных на 60 -- JSON/BSON хорошо сжимаются и получается отличная
> экономия RAM, как кэша ФС, ведь в ней сжатые ZFS объекты хранятся.
> 
Ok, вас понял. Сжатие оставляю. Кроме того, серьёзных вычислительных
задач, которые загрузят Xeon, там по-идее не будет: оно не должно мешать.


P.S.:
Нашёл калькуляторы.
http://wintelguy.com/zfs-calc.pl
https://jsfiddle.net/Biduleohm/paq5u7z5/1/embedded/result/


Reply to: