Низкая производительность записи программного массива RAID10 из 8 SSD-дисков

Question

Измеренные низкие показатели являются результатом различных факторов:

после создания массив полностью синхронизируется, что приводит к размещению большинства (если не всех) страниц флэш-данных на половине SSD. Это переведет SSD в состояние низкой производительности, пока безопасное стирание/обрезка не «освободит» все/большинство/некоторые страницы. Это объясняет возросшую производительность после fstrim;
размер фрагмента (по умолчанию) 512 КБ слишком велик для максимальной последовательной/потоковой производительности (согласно результатам тестирования dd). С массивом из одних SSD я бы выбрал размер фрагмента 64 КБ и, вероятно (но это должно быть подтверждено реальным тестом), с "дальней" компоновкой. Обратите внимание, что уменьшение размера фрагмента, хотя и полезно для потокового доступа, может наказать за случайное чтение/запись. Это в основном касается HDD, но даже SSD могут быть в некоторой степени затронуты;
по умолчанию ядро linux выдает максимум 512 КБ ввода-вывода. Это означает, что даже при запросе ddиспользования блоков размером 1 ГБ (как в вашей первой команде) они будут разделены на множество запросов размером 512 КБ. В сочетании с вашим 512 КБ-куском это задействуетодин SSD на запрос записи, в основном ограничивая производительность потоковой записи на уровне одного SSD и отрицая любое потенциальное увеличение скорости из-за RAID. Хотя вы можете использовать max_sectors_kbнастраиваемый параметр (найденный в /sys/block/sdX/queue/max_sectors_kb), значения больше 512 КБ могут (в некоторых версиях конфигурации/ядра) игнорироваться;
наконец, хотя это и интересно и обязательно для первой остановки, ddсамо по себе является плохим бенчмарком: он тестирует только производительность потоковой передачи при низкой (1) глубине очереди. Даже с вашей текущей конфигурацией массива более полный тест, как fioпоказал бы значительное увеличение производительности по сравнению со сценарием с одним диском, по крайней мере при случайном вводе-выводе.

Что вы можете сделать, чтобы исправить текущую ситуацию? Прежде всего, выдолженсогласитесь стереть диски/массив; очевидно, вынуждатьсясделать резервные копии в качестве первого шага. Затем:

остановить и удалить массив ( mdadm -S /dev/md2)
подрезатьвсеблоки данных налюбойдиск ( blkdiscard /dev/sdX3)
воссоздать массив с кусками по 64 КБ и счистыйфлаг ( mdadm --create /dev/md2 --level=10 --raid-devices=8 --chunk=64 --assume-clean /dev/sdX3)
переснять с помощью ddи fio;
Если все в порядке, восстановите резервную копию.

Последнее замечание о вашей настройке SATA: явно следует избегать такого разделения диска, чтобы получить максимальную производительность. Тем не менее, ваша скорость записи настолько низкая, что я бы не стал винить ваш контроллер SATA. Я бы действительно пересоздал массив по инструкции выше, прежде чем покупать что-то новое.

Answer 1

Измеренные низкие показатели являются результатом различных факторов:

после создания массив полностью синхронизируется, что приводит к размещению большинства (если не всех) страниц флэш-данных на половине SSD. Это переведет SSD в состояние низкой производительности, пока безопасное стирание/обрезка не «освободит» все/большинство/некоторые страницы. Это объясняет возросшую производительность после fstrim;
размер фрагмента (по умолчанию) 512 КБ слишком велик для максимальной последовательной/потоковой производительности (согласно результатам тестирования dd). С массивом из одних SSD я бы выбрал размер фрагмента 64 КБ и, вероятно (но это должно быть подтверждено реальным тестом), с "дальней" компоновкой. Обратите внимание, что уменьшение размера фрагмента, хотя и полезно для потокового доступа, может наказать за случайное чтение/запись. Это в основном касается HDD, но даже SSD могут быть в некоторой степени затронуты;
по умолчанию ядро linux выдает максимум 512 КБ ввода-вывода. Это означает, что даже при запросе ddиспользования блоков размером 1 ГБ (как в вашей первой команде) они будут разделены на множество запросов размером 512 КБ. В сочетании с вашим 512 КБ-куском это задействуетодин SSD на запрос записи, в основном ограничивая производительность потоковой записи на уровне одного SSD и отрицая любое потенциальное увеличение скорости из-за RAID. Хотя вы можете использовать max_sectors_kbнастраиваемый параметр (найденный в /sys/block/sdX/queue/max_sectors_kb), значения больше 512 КБ могут (в некоторых версиях конфигурации/ядра) игнорироваться;
наконец, хотя это и интересно и обязательно для первой остановки, ddсамо по себе является плохим бенчмарком: он тестирует только производительность потоковой передачи при низкой (1) глубине очереди. Даже с вашей текущей конфигурацией массива более полный тест, как fioпоказал бы значительное увеличение производительности по сравнению со сценарием с одним диском, по крайней мере при случайном вводе-выводе.

Что вы можете сделать, чтобы исправить текущую ситуацию? Прежде всего, выдолженсогласитесь стереть диски/массив; очевидно, вынуждатьсясделать резервные копии в качестве первого шага. Затем:

остановить и удалить массив ( mdadm -S /dev/md2)
подрезатьвсеблоки данных налюбойдиск ( blkdiscard /dev/sdX3)
воссоздать массив с кусками по 64 КБ и счистыйфлаг ( mdadm --create /dev/md2 --level=10 --raid-devices=8 --chunk=64 --assume-clean /dev/sdX3)
переснять с помощью ddи fio;
Если все в порядке, восстановите резервную копию.

Последнее замечание о вашей настройке SATA: явно следует избегать такого разделения диска, чтобы получить максимальную производительность. Тем не менее, ваша скорость записи настолько низкая, что я бы не стал винить ваш контроллер SATA. Я бы действительно пересоздал массив по инструкции выше, прежде чем покупать что-то новое.

Низкая производительность записи программного массива RAID10 из 8 SSD-дисков

решение1

Связанный контент