df difere muito de du, o serviço nfsd parece importante

df difere muito de du, o serviço nfsd parece importante

Eu sei que tem havido muita discussão sobre o tópico da discrepância df/du. Mas aqui eu postaria uma edição especial e pediria algumas dicas. aqui está o detalhe (com um hardware raid5 com 6 discos sas)

  1. informações do sistema do servidor/cliente nfs: [root@ndio06 ~]# cat /etc/liberar|grep CentOS CentOS Linux versão 7.6.1810 (Core) NAME="CentOS Linux" PRETTY_NAME="CentOS Linux 7 (Core)" CENTOS_MANTISBT_PROJECT="CentOS-7" CentOS Linux versão 7.6.1810 (Core) [root@ndio06 ~] # uname -a Linux ndio06 3.10.0-957.el7.x86_64 #1 SMP Qui, 8 de novembro 23:39:32 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux [root@ndio06 ~]# rpm -qa|grep nfs-util nfs -utils-1.3.0-0.61.el7.x86_64

O servidor nfs normalmente está sob carga pesada atendendo 48 nós ocupados com muitos processos, operação io.

  1. df/du não alinhado e a lacuna é enorme: [root@ndio06 ~]# df -hl /CAE;du -sh /CAE Tamanho do sistema de arquivos usado Disponível Uso% Montado em /dev/sdb1 5.0T 3.6T 1.4T 73% /CAE 736G /CAE

  2. nenhum arquivo “excluído, mas em uso” no servidor NFS ou em mais de 40 clientes: [root@pbs ~]# for node in pestat|grep ndpam02|awk {'print $1'}|grep -v io; faça echo --$node--;ssh $node lsof +D /CAE|grep -i "excluído" ;feito --nd065-- --nd066-- --nd067-- ......... .

  3. opções de montagem nos clientes:

ndio06-ib:/CAE em /CAE tipo nfs4 (rw,relatime,vers=4.1,rsize=1048576,wsize=1048576,namlen=255,soft,proto=tcp,timeo=600,retrans=2,sec=sys, clienteaddr=192.168.1.72,local_lock=none,addr=192.168.1.161)

  1. o que foi observado: - um xfs_repair após a desmontagem resolveria o problema, porém ele surgiria novamente após algumas semanas. Infelizmente não capturei as informações durante o reparo para ver se há algum problema físico com o ataque/discos.
  • uma reinicialização do serviço nfsd resolveria o problema e o df daria a porcentagem correta após algumas tentativas (cada tentativa obteria uma porcentagem menor usada%) ou esperaria alguns minutos. Novamente, é apenas uma correção temporária e o problema surgiria alguns dias ou semanas depois.
  • O serviço nfs ainda responde, a menos que o df relate 100% de uso. O número do thread nfsd está definido como 8.

Alguém pode gentilmente dar uma luz sobre esse assunto? Pode fornecer mais informações, se necessário.

Obrigado.

informação relacionada