
Sé que ha habido mucha discusión sobre el tema de la discrepancia df/du. Pero aquí publicaría un número especial y pediría algunas sugerencias. aquí está el detalle (con un hardware raid5 con 6 discos sas)
- información del sistema del servidor/cliente nfs: [root@ndio06 ~]# cat /etc/liberar|grep CentOS CentOS Linux versión 7.6.1810 (Núcleo) NAME="CentOS Linux" PRETTY_NAME="CentOS Linux 7 (Núcleo)" CENTOS_MANTISBT_PROJECT="CentOS-7" CentOS Linux versión 7.6.1810 (Núcleo) [root@ndio06 ~] # uname -a Linux ndio06 3.10.0-957.el7.x86_64 #1 SMP jueves 8 de noviembre 23:39:32 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux [root@ndio06 ~]# rpm -qa|grep nfs-util nfs -utils-1.3.0-0.61.el7.x86_64
El servidor nfs normalmente está bajo una gran carga y atiende a 48 nodos ocupados con muchos procesos y operación io.
df/du no está alineado y la brecha es enorme: [root@ndio06 ~]# df -hl /CAE;du -sh /CAE Tamaño del sistema de archivos utilizado % de uso disponible Montado en /dev/sdb1 5.0T 3.6T 1.4T 73% /CAE 736G /CAE
no hay archivos “eliminados pero en uso” en el servidor nfs o en más de 40 clientes: [root@pbs ~]# para el nodo en
pestat|grep ndpam02|awk {'print $1'}|grep -v io
; hacer echo --$nodo--;ssh $nodo lsof +D /CAE|grep -i "eliminado" ;hecho --nd065-- --nd066-- --nd067-- ......... .opciones de montaje en los clientes:
ndio06-ib:/CAE en /CAE tipo nfs4 (rw,relatime,vers=4.1,rsize=1048576,wsize=1048576,namlen=255,soft,proto=tcp,timeo=600,retrans=2,sec=sys, clientaddr=192.168.1.72,local_lock=none,addr=192.168.1.161)
- lo que se ha observado: - un xfs_repair después del desmontaje solucionaría el problema, sin embargo, volvería a aparecer después de algunas semanas. Desafortunadamente, no capturé la información durante la reparación para ver si hay problemas físicos con el raid/los discos.
- un reinicio del servicio nfsd lo solucionaría y df daría el porcentaje correcto después de algunos intentos (cada intento obtendría un porcentaje menor%) o esperaría unos minutos. Nuevamente, se trata solo de una solución temporal y el problema surgiría unos días o semanas después.
- El servicio nfs sigue respondiendo a menos que df informe un uso del 100%. El número de hilo nfsd está establecido en 8.
¿Alguien puede amablemente arrojar luz sobre este tema? Puede proporcionar más información si es necesario.
Gracias.