proxmox 上の ZFS raidz3 に IO の問題がある

2024-6-23 • tag-icon

私は 256GB ECC RAM と次の raidz3 プールを搭載した Proxmox 6.2-11 を実行しています。

pool: rpool
state: ONLINE
scan: scrub repaired 0B in 0 days 15:25:14 with 0 errors on Sun Jan 10 15:49:29 2021
config:

NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
raidz3-0 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JDUHAR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JDWWAR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JB5AYR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JBYYTR-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MHXH-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9M248-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MQ9E-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MN5A-part4 ONLINE 0 0 0

errors: No known data errors


NAME SIZE ALLOC FREE CKPOINT EXPANDSZ FRAG CAP DEDUP HEALTH ALTROOT
rpool 43.6T 9.71T 33.9T - - 10% 22% 1.00x ONLINE -

数週間前から proxmox ホストで IO 待機時間の大幅な増加 (2 ～ 3%) を感じており、iotop で txg_sync が 95 ～ 99.99% の IO で最大になっているのがわかります。ゲストインスタンスの 1 つ /Debian/ では、jdb2/vda1-8 がほとんどの場合 99.99% になっているのがわかります。

ゲストとホストの両方で十分な RAM が使用可能です。問題は何でしょうか?

答え1

PVE 6.3 (ZFS 0.8.4 -> 0.8.6) にアップグレードしたところ、今のところ問題は解決しました。

答え1

関連情報