Degradación masiva del rendimiento en escritura secuencial sostenida

Question 1

El disco de control está conectado a un puerto SATA integrado en la placa base.

Como se indicó, los discos que experimentan problemas de tiempo de espera de descarga del diario están conectados al PERC, el mismo controlador al que están conectados los Toshiba "problemáticos".

La PERC 310 es sólo una tarjeta raid de hardware básica. Es probable que su CPU se abrume fácilmente, ya sea eso o hay un error de firmware. El AHCI directo no es un uso muy común.

Yo sugeriría que el IO se está bloqueando en el PERC y no en el sistema operativo.

Answer

El disco de control está conectado a un puerto SATA integrado en la placa base.

Como se indicó, los discos que experimentan problemas de tiempo de espera de descarga del diario están conectados al PERC, el mismo controlador al que están conectados los Toshiba "problemáticos".

La PERC 310 es sólo una tarjeta raid de hardware básica. Es probable que su CPU se abrume fácilmente, ya sea eso o hay un error de firmware. El AHCI directo no es un uso muy común.

Yo sugeriría que el IO se está bloqueando en el PERC y no en el sistema operativo.

Question 2

Esto es mucho para digerir.

Está utilizando ZFS, por lo que es muy probable que se trate de un problema con los discos de 5 TB de su grupo y, potencialmente, con la configuración de su grupo.

Estos pueden ser discos de sector 4k, por lo que se deben realizar algunas adaptaciones en su configuración ZFS para tenerlo en cuenta.

¿ Puede proporcionar su df -h, fdisk -l, y salida?zpool listzpool status -vzfs list

Answer

Esto es mucho para digerir.

Está utilizando ZFS, por lo que es muy probable que se trate de un problema con los discos de 5 TB de su grupo y, potencialmente, con la configuración de su grupo.

Estos pueden ser discos de sector 4k, por lo que se deben realizar algunas adaptaciones en su configuración ZFS para tenerlo en cuenta.

¿ Puede proporcionar su df -h, fdisk -l, y salida?zpool listzpool status -vzfs list

Question 3

Creo que su caché de escritura es demasiado grande en comparación con las velocidades de su dispositivo de bloqueo. Yo sugeriría lo siguiente:

vm.dirty_background_bytes = 50000000
vm.dirty_bytes = 200000000
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 20

Nunca jamás establezcas ambos *_bytesy *_ratioporque ganará el último que se establezca. Además, algunas versiones del kernel de Linux pueden tener un error en el que la configuración *_rationo funciona según lo previsto. Sugeriría usarlo *_bytescada vez.

Desafortunadamente, hasta donde yo sé, la configuración de la caché de escritura es global. Como resultado, el rendimiento de sus dispositivos más rápidos se verá afectado un poco cuando necesite reducir el tamaño de la caché de escritura global debido a algún dispositivo lento.

Answer

Creo que su caché de escritura es demasiado grande en comparación con las velocidades de su dispositivo de bloqueo. Yo sugeriría lo siguiente:

vm.dirty_background_bytes = 50000000
vm.dirty_bytes = 200000000
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 20

Nunca jamás establezcas ambos *_bytesy *_ratioporque ganará el último que se establezca. Además, algunas versiones del kernel de Linux pueden tener un error en el que la configuración *_rationo funciona según lo previsto. Sugeriría usarlo *_bytescada vez.

Desafortunadamente, hasta donde yo sé, la configuración de la caché de escritura es global. Como resultado, el rendimiento de sus dispositivos más rápidos se verá afectado un poco cuando necesite reducir el tamaño de la caché de escritura global debido a algún dispositivo lento.

Degradación masiva del rendimiento en escritura secuencial sostenida

información adicional

Hechos rápidos

Programadores de E/S

`vm.dirty*`parámetros del núcleo

Ejemplos de lentitud detectada y registrada en`/var/log/syslog`

Respuesta1

Respuesta2

Respuesta3

información relacionada