CPL alto resuelto temporalmente mediante el reinicio de NFS

CPL alto resuelto temporalmente mediante el reinicio de NFS

CentOS 6.9

Tengo un servidor de archivos NFS (v4) cuyas exportaciones comenzaron a volverse muy lentas para responder a los clientes de hoy. Mientras esto sucede, los volúmenes exportados no son lentos en el servidor.

arriba muestra valores de CPL muy altos (> 100). Por lo demás, nada parece fuera de lo común.

Si reinicio nfs ( service nfs restart), los valores de CPL rápidamente comienzan a disminuir y los volúmenes vuelven a responder en los clientes. Sin embargo, después de 2 o 3 minutos, los valores de CPL comienzan a subir nuevamente.

dmesg no muestra nada más que algunos mensajes cuando reinicio nfs.

/var/log/messages no muestra nada que parezca relevante

¿Alguien tiene alguna idea sobre lo que podría estar pasando?

Respuesta1

   CPL  CPU load information.
        This  line contains the load average figures reflecting the number of threads that are available to run on a CPU (i.e. part of the runqueue) or that are wait‐
        ing for disk I/O. These figures are averaged over 1 (`avg1'), 5 (`avg5') and 15 (`avg15') minutes.
        Furthermore the number of context switches (`csw'), the number of serviced interrupts (`intr') and the number of available CPUs are shown.

Creo que lo importante se aprende de esto waiting for disk I/O. Apuesto a que un cliente está intentando hacer algo extraño con los discos y está provocando una desaceleración en el resto de los clientes. ¿Ha verificado qué tipo de ancho de banda de red se está utilizando? ¿El enlace está completamente saturado?

información relacionada