NFS를 다시 시작하면 일시적으로 높은 CPL이 해결됩니다.

NFS를 다시 시작하면 일시적으로 높은 CPL이 해결됩니다.

센트OS 6.9

오늘 클라이언트에서 내보내기 응답 속도가 매우 느려지기 시작한 NFS(v4) 파일 서버가 있습니다. 이런 일이 발생하는 동안 내보낸 볼륨은 서버 자체에서 느려지지 않습니다.

atop은 매우 높은 CPL 값(> 100)을 보여줍니다. 그렇지 않으면 아무것도 평범해 보이지 않습니다.

nfs()를 다시 시작하면 service nfs restartCPL 값이 빠르게 떨어지기 시작하고 클라이언트에서 볼륨이 다시 응답하게 됩니다. 하지만 2~3분 정도 지나면 CPL 값이 다시 오르기 시작합니다.

dmesg는 nfs를 다시 시작할 때 일부 메시지 외에는 아무것도 표시하지 않습니다.

/var/log/messages에는 관련성이 있어 보이는 내용이 표시되지 않습니다.

무슨 일이 일어나고 있는지에 대한 아이디어가 있는 사람이 있나요?

답변1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
        Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.

나는 이것에서 중요한 것을 빼앗아 간다고 생각합니다 waiting for disk I/O. 나는 클라이언트가 디스크를 사용하여 이상한 작업을 시도하고 있으며 이로 인해 나머지 클라이언트의 속도가 느려지고 있다고 확신합니다. 어떤 종류의 네트워크 대역폭이 사용되고 있는지 확인하셨나요? 링크가 완전히 포화되었나요?

관련 정보