Значительное снижение производительности при продолжительной последовательной записи

Question 1

Управляющий диск подключается к порту SATA, встроенному в материнскую плату.

Как уже говорилось, диски, на которых возникают проблемы с тайм-аутом очистки журнала, подключены к PERC — тому же контроллеру, к которому подключены «проблемные» диски Toshiba.

PERC 310 — это всего лишь базовая аппаратная карта raid. Ее ЦП, вероятно, легко перегружается, либо это ошибка прошивки. Прямой AHCI не очень распространенное использование.

Я бы предположил, что блокировка ввода-вывода происходит на PERC, а не на ОС.

Answer

Управляющий диск подключается к порту SATA, встроенному в материнскую плату.

Как уже говорилось, диски, на которых возникают проблемы с тайм-аутом очистки журнала, подключены к PERC — тому же контроллеру, к которому подключены «проблемные» диски Toshiba.

PERC 310 — это всего лишь базовая аппаратная карта raid. Ее ЦП, вероятно, легко перегружается, либо это ошибка прошивки. Прямой AHCI не очень распространенное использование.

Я бы предположил, что блокировка ввода-вывода происходит на PERC, а не на ОС.

Question 2

Это очень сложная информация для осмысления.

Вы используете ZFS, поэтому вполне вероятно, что проблема связана с дисками объемом 5 ТБ в вашем пуле и, возможно, с настройками пула.

Это могут быть диски с секторами размером 4 КБ, поэтому в настройках ZFS следует предусмотреть некоторые изменения, чтобы это учесть.

Можете ли вы предоставить свои df -h, fdisk -l, zpool list, zpool status -vи zfs listвыходные данные?

Answer

Это очень сложная информация для осмысления.

Вы используете ZFS, поэтому вполне вероятно, что проблема связана с дисками объемом 5 ТБ в вашем пуле и, возможно, с настройками пула.

Это могут быть диски с секторами размером 4 КБ, поэтому в настройках ZFS следует предусмотреть некоторые изменения, чтобы это учесть.

Можете ли вы предоставить свои df -h, fdisk -l, zpool list, zpool status -vи zfs listвыходные данные?

Question 3

Я думаю, что ваш кэш записи слишком велик по сравнению со скоростью вашего блочного устройства. Я бы предложил следующее:

vm.dirty_background_bytes = 50000000
vm.dirty_bytes = 200000000
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 20

Никогда не устанавливайте оба *_bytes, *_ratioпотому что последний установленный параметр будет иметь преимущество. Кроме того, некоторые версии ядра Linux могут иметь ошибку, из-за которой настройка *_ratioне работает так, как задумано. Я бы рекомендовал использовать *_bytesкаждый раз.

К сожалению, настройки кэша записи глобальны, насколько мне известно. В результате пропускная способность для ваших более быстрых устройств немного пострадает, когда вам нужно будет уменьшить размер глобального кэша записи из-за какого-то медленного устройства.

Answer

Я думаю, что ваш кэш записи слишком велик по сравнению со скоростью вашего блочного устройства. Я бы предложил следующее:

vm.dirty_background_bytes = 50000000
vm.dirty_bytes = 200000000
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 20

Никогда не устанавливайте оба *_bytes, *_ratioпотому что последний установленный параметр будет иметь преимущество. Кроме того, некоторые версии ядра Linux могут иметь ошибку, из-за которой настройка *_ratioне работает так, как задумано. Я бы рекомендовал использовать *_bytesкаждый раз.

К сожалению, настройки кэша записи глобальны, насколько мне известно. В результате пропускная способность для ваших более быстрых устройств немного пострадает, когда вам нужно будет уменьшить размер глобального кэша записи из-за какого-то медленного устройства.

Значительное снижение производительности при продолжительной последовательной записи

Дополнительная информация

Краткие факты

Планировщики ввода-вывода

`vm.dirty*`параметры ядра

Примеры замедления, обнаруженные и зарегистрированные в журнале`/var/log/syslog`

решение1

решение2

решение3

Связанный контент