df difiere mucho de du, el servicio nfsd parece importante

df difiere mucho de du, el servicio nfsd parece importante

Sé que ha habido mucha discusión sobre el tema de la discrepancia df/du. Pero aquí publicaría un número especial y pediría algunas sugerencias. aquí está el detalle (con un hardware raid5 con 6 discos sas)

  1. información del sistema del servidor/cliente nfs: [root@ndio06 ~]# cat /etc/liberar|grep CentOS CentOS Linux versión 7.6.1810 (Núcleo) NAME="CentOS Linux" PRETTY_NAME="CentOS Linux 7 (Núcleo)" CENTOS_MANTISBT_PROJECT="CentOS-7" CentOS Linux versión 7.6.1810 (Núcleo) [root@ndio06 ~] # uname -a Linux ndio06 3.10.0-957.el7.x86_64 #1 SMP jueves 8 de noviembre 23:39:32 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux [root@ndio06 ~]# rpm -qa|grep nfs-util nfs -utils-1.3.0-0.61.el7.x86_64

El servidor nfs normalmente está bajo una gran carga y atiende a 48 nodos ocupados con muchos procesos y operación io.

  1. df/du no está alineado y la brecha es enorme: [root@ndio06 ~]# df -hl /CAE;du -sh /CAE Tamaño del sistema de archivos utilizado % de uso disponible Montado en /dev/sdb1 5.0T 3.6T 1.4T 73% /CAE 736G /CAE

  2. no hay archivos “eliminados pero en uso” en el servidor nfs o en más de 40 clientes: [root@pbs ~]# para el nodo en pestat|grep ndpam02|awk {'print $1'}|grep -v io; hacer echo --$nodo--;ssh $nodo lsof +D /CAE|grep -i "eliminado" ;hecho --nd065-- --nd066-- --nd067-- ......... .

  3. opciones de montaje en los clientes:

ndio06-ib:/CAE en /CAE tipo nfs4 (rw,relatime,vers=4.1,rsize=1048576,wsize=1048576,namlen=255,soft,proto=tcp,timeo=600,retrans=2,sec=sys, clientaddr=192.168.1.72,local_lock=none,addr=192.168.1.161)

  1. lo que se ha observado: - un xfs_repair después del desmontaje solucionaría el problema, sin embargo, volvería a aparecer después de algunas semanas. Desafortunadamente, no capturé la información durante la reparación para ver si hay problemas físicos con el raid/los discos.
  • un reinicio del servicio nfsd lo solucionaría y df daría el porcentaje correcto después de algunos intentos (cada intento obtendría un porcentaje menor%) o esperaría unos minutos. Nuevamente, se trata solo de una solución temporal y el problema surgiría unos días o semanas después.
  • El servicio nfs sigue respondiendo a menos que df informe un uso del 100%. El número de hilo nfsd está establecido en 8.

¿Alguien puede amablemente arrojar luz sobre este tema? Puede proporcionar más información si es necesario.

Gracias.

información relacionada