CentOS 6.9
Eu tenho um servidor de arquivos NFS (v4) cujas exportações começaram a ficar muito lentas para responder aos clientes hoje. Enquanto isso acontece, os volumes exportados não ficam lentos no próprio servidor.
no topo mostra valores de CPL muito altos (> 100). Caso contrário, nada parece fora do comum.
Se eu reiniciar o nfs ( service nfs restart
), os valores de CPL começarão a cair rapidamente e os volumes voltarão a responder nos clientes. No entanto, após 2 ou 3 minutos, os valores de CPL começam a subir novamente.
O dmesg não mostra nada além de algumas mensagens quando eu reinicio o nfs.
/var/log/messages não mostra nada que pareça relevante
Alguém tem alguma idéia sobre o que pode estar acontecendo?
Responder1
CPL CPU load information.
This line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.
Eu acho que a conclusão importante disso waiting for disk I/O
. Aposto que um cliente está tentando fazer algo estranho com os discos e isso está causando lentidão para o restante dos clientes. Você verificou que tipo de largura de banda de rede está sendo usada? O link está totalmente saturado?