私は 256GB ECC RAM と次の raidz3 プールを搭載した Proxmox 6.2-11 を実行しています。
pool: rpool
state: ONLINE
scan: scrub repaired 0B in 0 days 15:25:14 with 0 errors on Sun Jan 10 15:49:29 2021
config:
NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
raidz3-0 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JDUHAR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JDWWAR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JB5AYR-part4 ONLINE 0 0 0
ata-HGST_HUS726T6TALE6L4_V8JBYYTR-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MHXH-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9M248-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MQ9E-part4 ONLINE 0 0 0
ata-ST6000NM0115-1YZ110_ZAD9MN5A-part4 ONLINE 0 0 0
errors: No known data errors
NAME SIZE ALLOC FREE CKPOINT EXPANDSZ FRAG CAP DEDUP HEALTH ALTROOT
rpool 43.6T 9.71T 33.9T - - 10% 22% 1.00x ONLINE -
数週間前から proxmox ホストで IO 待機時間の大幅な増加 (2 ~ 3%) を感じており、iotop で txg_sync が 95 ~ 99.99% の IO で最大になっているのがわかります。ゲスト インスタンスの 1 つ /Debian/ では、jdb2/vda1-8 がほとんどの場合 99.99% になっているのがわかります。
ゲストとホストの両方で十分な RAM が使用可能です。問題は何でしょうか?
答え1
PVE 6.3 (ZFS 0.8.4 -> 0.8.6) にアップグレードしたところ、今のところ問題は解決しました。