高 CPL 透過 NFS 重新啟動暫時解決

高 CPL 透過 NFS 重新啟動暫時解決

CentOS 6.9

我有一個 NFS (v4) 檔案伺服器,今天其匯出在客戶端上的回應速度開始變得非常慢。當發生這種情況時,導出的磁碟區在伺服器本身上並不慢。

atop 顯示非常高的 CPL 值 (> 100)。否則看起來沒什麼異常。

如果我重新啟動 nfs ( service nfs restart),CPL 值會快速開始下降,並且磁碟區在客戶端上再次變得回應。然而 2 或 3 分鐘後,CPL 值再次開始攀升。

當我重新啟動 nfs 時,dmesg 除了一些訊息之外不顯示任何其他內容。

/var/log/messages 沒有顯示任何看起來相關的內容

有人對可能發生的事情有任何想法嗎?

答案1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
        Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.

我認為這一點很重要waiting for disk I/O。我敢打賭,某個客戶端正試圖對磁碟做一些奇怪的事情,這會導致其他客戶端的速度變慢。您是否檢查過正在使用哪種網路頻寬?鏈路是否完全飽和?

相關內容