Неожиданная производительность асинхронной записи ZFS при разной глубине очереди

Неожиданная производительность асинхронной записи ZFS при разной глубине очереди

По какой-то причине QD2 кажется лучшим с точки зрения чистого IOPS...

Увидев интересную статьюсравнение нескольких разных дисков для использования SLOGМне стало интересно узнать о производительности моей собственной системы при разной глубине очереди.

Система включает i9-13900K, 128 ГБ DDR5-4800 системной памяти и два Samsung 980 PRO в качестве одного зеркального Vdev. Тест запускает FIO в следующей конфигурации в контейнере на ProxMox 7:

fio --name=random-write --ioengine=posixaio --rw=randwrite --bs=<4k/8k> --numjobs=1 --size=8g --iodepth=<1/2/4/8> --runtime=30 --time_based

Я заметил одну странность: во время асинхронной записи наилучшая производительность неизменно наблюдалась при глубине очереди 2. Я перепробовал несколько различных комбинаций сжатия, размера блока и размера записи, но QD2 неизменно показывал наилучшие результаты IOPS... Я ожидал, что при более высокой глубине очереди производительность будет выше, или я что-то упускаю? (Интересно, связано ли это с тем, что на дисках всего по два чипа NAND на диск?)

Никакой специальной настройки ZFS не производилось, кроме установки ashift=12 и того, что перечислено выше.

Кто-нибудь знает, почему асинхронная запись ZFS работает лучше всего на QD2 по сравнению с QD1, QD4 или QD8?

А теперь... Графики! Это усредненные результаты 216 различных комбинаций, которые я попробовал.

IOPS и размер записи (почему размер записи в 16k оказался худшим, мне непонятно) IOPS против размера блока FIO (Размер блока 8 КБ все равно приводит к большему общемупропускная способность) IOPS против сжатия

Немного удивлен, что Zstd обошел LZ4. Возможно, я достигаю пределов ввода-вывода этих бедных SSD?действительныйВо время тестирования активность SSD обычно достигала 400–700 МБ/с.

Примечание. Во время всех тестов регулятор ЦП был установлен в положение «Производительность». При установке значения «Энергосбережение» показатели IOPS были на 30–50 % хуже!

Связанный контент