NFS の再起動により、高い CPL が一時的に解決されました。

NFS の再起動により、高い CPL が一時的に解決されました。

6.9 の

NFS (v4) ファイル サーバーを所有していますが、今日からクライアントでのエクスポートの応答が非常に遅くなり始めました。この現象が発生している間、エクスポートされたボリュームはサーバー自体では遅くなりません。

上部に非常に高い CPL 値 (> 100) が表示されます。それ以外は異常はありません。

nfs ( service nfs restart) を再起動すると、CPL 値が急速に低下し始め、ボリュームがクライアント上で再び応答するようになります。ただし、2 ~ 3 分後には、CPL 値が再び上昇し始めます。

nfs を再起動しても、dmesg にはいくつかのメッセージ以外は何も表示されません。

/var/log/messagesには関連性のあるものは何もありません

何が起こっているのか、何か考えのある人はいますか?

答え1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
        Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.

ここから得られる重要な教訓はwaiting for disk I/O、クライアントがディスクで何かおかしなことをしようとして、それが他のクライアントの速度低下を引き起こしているのではないかということです。どのようなネットワーク帯域幅が使用されているか確認しましたか? リンクは完全に飽和状態になっていますか?

関連情報