Massiver Leistungsabfall bei anhaltendem sequentiellem Schreiben

Question 1

Die Steuerfestplatte ist an einen im Motherboard integrierten SATA-Anschluss angeschlossen.

Wie bereits erwähnt sind die Festplatten, bei denen es zu Timeout-Problemen beim Leeren des Journals kommt, mit dem PERC verbunden, demselben Controller, an den auch die „problematischen“ Toshibas angeschlossen sind.

Die PERC 310 ist nur eine einfache Hardware-RAID-Karte. Ihre CPU ist wahrscheinlich leicht überlastet, entweder das oder es liegt ein Firmware-Fehler vor. Direktes AHCI ist keine sehr verbreitete Verwendung.

Ich würde vorschlagen, dass die IO auf dem PERC blockiert ist und nicht auf dem Betriebssystem.

Answer

Die Steuerfestplatte ist an einen im Motherboard integrierten SATA-Anschluss angeschlossen.

Wie bereits erwähnt sind die Festplatten, bei denen es zu Timeout-Problemen beim Leeren des Journals kommt, mit dem PERC verbunden, demselben Controller, an den auch die „problematischen“ Toshibas angeschlossen sind.

Die PERC 310 ist nur eine einfache Hardware-RAID-Karte. Ihre CPU ist wahrscheinlich leicht überlastet, entweder das oder es liegt ein Firmware-Fehler vor. Direktes AHCI ist keine sehr verbreitete Verwendung.

Ich würde vorschlagen, dass die IO auf dem PERC blockiert ist und nicht auf dem Betriebssystem.

Question 2

Das ist eine Menge, die man verdauen muss.

Sie verwenden ZFS, daher besteht eine gute Chance, dass dies ein Problem mit den 5-TB-Festplatten in Ihrem Pool und möglicherweise Ihrem Pool-Setup ist.

Dabei kann es sich um Festplatten mit 4.000 Sektoren handeln. Daher sollten Sie bei Ihrem ZFS-Setup entsprechende Anpassungen vornehmen.

Können Sie Ihre df -h, fdisk -l, zpool list, zpool status -vund zfs list-Ausgabe bereitstellen?

Answer

Das ist eine Menge, die man verdauen muss.

Sie verwenden ZFS, daher besteht eine gute Chance, dass dies ein Problem mit den 5-TB-Festplatten in Ihrem Pool und möglicherweise Ihrem Pool-Setup ist.

Dabei kann es sich um Festplatten mit 4.000 Sektoren handeln. Daher sollten Sie bei Ihrem ZFS-Setup entsprechende Anpassungen vornehmen.

Können Sie Ihre df -h, fdisk -l, zpool list, zpool status -vund zfs list-Ausgabe bereitstellen?

Question 3

Ich denke, Ihr Schreibcache ist im Vergleich zu Ihren Blockgerätegeschwindigkeiten zu groß. Ich würde Folgendes vorschlagen:

vm.dirty_background_bytes = 50000000
vm.dirty_bytes = 200000000
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 20

Legen Sie niemals beide Werte fest, da der zuletzt festgelegte Wert gewinnt. Darüber hinaus können einige Linux-Kernelversionen einen Fehler aufweisen, bei dem die Einstellung *_bytesnicht wie vorgesehen funktioniert. Ich würde empfehlen, sie immer zu verwenden.*_ratio*_ratio*_bytes

Leider sind die Schreibcache-Einstellungen meines Wissens global. Daher wird der Durchsatz zu Ihren schnelleren Geräten etwas leiden, wenn Sie die globale Schreibcache-Größe aufgrund eines langsamen Geräts reduzieren müssen.

Answer

Ich denke, Ihr Schreibcache ist im Vergleich zu Ihren Blockgerätegeschwindigkeiten zu groß. Ich würde Folgendes vorschlagen:

vm.dirty_background_bytes = 50000000
vm.dirty_bytes = 200000000
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 20

Legen Sie niemals beide Werte fest, da der zuletzt festgelegte Wert gewinnt. Darüber hinaus können einige Linux-Kernelversionen einen Fehler aufweisen, bei dem die Einstellung *_bytesnicht wie vorgesehen funktioniert. Ich würde empfehlen, sie immer zu verwenden.*_ratio*_ratio*_bytes

Leider sind die Schreibcache-Einstellungen meines Wissens global. Daher wird der Durchsatz zu Ihren schnelleren Geräten etwas leiden, wenn Sie die globale Schreibcache-Größe aufgrund eines langsamen Geräts reduzieren müssen.

Massiver Leistungsabfall bei anhaltendem sequentiellem Schreiben

Weitere Informationen

Schnelle Fakten

E/A-Scheduler

`vm.dirty*`Kernel-Parameter

Beispiele für erkannte und protokollierte Verlangsamungen`/var/log/syslog`

Antwort1

Antwort2

Antwort3

verwandte Informationen