非常簡單:這台伺服器有一個 SSD 作為主驅動器,還有一個 RAID 陣列(mdadm)用於儲存。
間歇性地,它在寫入數組時遇到問題:寫入速度減慢到實際上無法使用的程度。
我剛剛測試完速度,將一個1G的檔案從SSD複製到RAID陣列花了將近一個小時:
root@office:/tmp# rsync -vhr --progress test.img /mnt/raid/
sending incremental file list
test.img
1.07G 100% 301.99kB/s 0:57:52 (xfer#1, to-check=0/1)
sent 1.07G bytes received 31 bytes 309.25K bytes/sec
total size is 1.07G speedup is 1.0
RAID 陣列似乎沒問題:
root@office:/tmp# cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sdb[0] sdd[3] sdc[1]
5860270080 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
unused devices: <none>
且 syslog 沒有提及任何內容。
我還應該在哪裡尋找解決此問題的方法?
附言。大約一個月前,雷雨過後我們不得不更換開關。這個問題也是在那個時候開始的。我無法判斷這是主機板或控制器故障,還是其他損壞的東西。在我建議客戶開始更換硬體之前,我更願意找到確鑿的證據...
答案1
原來有一個 cron 作業正在運行同步;每 60 秒一次。它產生瞭如此多的殭屍進程,以至於 RAID 陣列的速度減慢到了極點。這個故事的寓意是:檢查你的 cron 作業。