CPL alto resolvido temporariamente pela reinicialização do NFS

CPL alto resolvido temporariamente pela reinicialização do NFS

CentOS 6.9

Eu tenho um servidor de arquivos NFS (v4) cujas exportações começaram a ficar muito lentas para responder aos clientes hoje. Enquanto isso acontece, os volumes exportados não ficam lentos no próprio servidor.

no topo mostra valores de CPL muito altos (> 100). Caso contrário, nada parece fora do comum.

Se eu reiniciar o nfs ( service nfs restart), os valores de CPL começarão a cair rapidamente e os volumes voltarão a responder nos clientes. No entanto, após 2 ou 3 minutos, os valores de CPL começam a subir novamente.

O dmesg não mostra nada além de algumas mensagens quando eu reinicio o nfs.

/var/log/messages não mostra nada que pareça relevante

Alguém tem alguma idéia sobre o que pode estar acontecendo?

Responder1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
        Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.

Eu acho que a conclusão importante disso waiting for disk I/O. Aposto que um cliente está tentando fazer algo estranho com os discos e isso está causando lentidão para o restante dos clientes. Você verificou que tipo de largura de banda de rede está sendo usada? O link está totalmente saturado?

informação relacionada