Высокий CPL временно устранен перезапуском NFS

Высокий CPL временно устранен перезапуском NFS

CentOS 6.9

У меня есть файловый сервер NFS (v4), экспорты которого сегодня стали очень медленно реагировать на клиентах. Пока это происходит, экспортированные тома не замедляются на самом сервере.

atop показывает очень высокие значения CPL (> 100). В остальном ничего необычного не выглядит.

Если я перезапускаю nfs ( service nfs restart), значения CPL быстро начинают падать, и тома снова становятся отзывчивыми на клиентах. Однако через 2 или 3 минуты значения CPL снова начинают расти.

dmesg не показывает ничего, кроме некоторых сообщений, когда я перезапускаю nfs.

/var/log/messages не показывает ничего, что выглядело бы релевантным

Есть ли у кого-нибудь идеи о том, что может происходить?

решение1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
        Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.

Я думаю, что важный вывод из этого waiting for disk I/O. Держу пари, что клиент пытается сделать что-то странное с дисками, и это вызывает замедление для остальных клиентов. Вы проверяли, какая полоса пропускания сети используется? Полностью ли загружен канал?

Связанный контент