CentOS 6.9
我有一個 NFS (v4) 檔案伺服器,今天其匯出在客戶端上的回應速度開始變得非常慢。當發生這種情況時,導出的磁碟區在伺服器本身上並不慢。
atop 顯示非常高的 CPL 值 (> 100)。否則看起來沒什麼異常。
如果我重新啟動 nfs ( service nfs restart
),CPL 值會快速開始下降,並且磁碟區在客戶端上再次變得回應。然而 2 或 3 分鐘後,CPL 值再次開始攀升。
當我重新啟動 nfs 時,dmesg 除了一些訊息之外不顯示任何其他內容。
/var/log/messages 沒有顯示任何看起來相關的內容
有人對可能發生的事情有任何想法嗎?
答案1
CPL CPU load information.
This line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.
我認為這一點很重要waiting for disk I/O
。我敢打賭,某個客戶端正試圖對磁碟做一些奇怪的事情,這會導致其他客戶端的速度變慢。您是否檢查過正在使用哪種網路頻寬?鏈路是否完全飽和?