Como tornar o NFS mais robusto quando o servidor descarta dispositivos

Como tornar o NFS mais robusto quando o servidor descarta dispositivos

Eu tenho um caso em que tenho uma máquina que possui várias montagens NFS. De vez em quando, um dos servidores NFS perde seus dispositivos devido a um problema de hardware que requer uma reinicialização para ser corrigido.

Então, os usuários chegam através de algo como ftp, fazem um ls em um diretório e ele trava. Então eles normalmente ficam frustrados e tentam novamente. Isso acaba travando a máquina cliente, usando todas as sessões FTP.

Existe alguma maneira de fazer com que o NFS simplesmente elimine a montagem, de modo que, quando eles fizerem um ls, obtenham apenas um diretório vazio? Ou há alguma maneira de detectar quando um host NFS não está respondendo corretamente e descartá-lo? ... Ou posso fazer isso do lado do servidor de alguma forma quando as unidades acabarem?

Responder1

Primeiro você precisa alterar suas montagens nfs para as opções interrompíveis (intr na maioria dos sabores). Isso permitirá que você execute Ctl-C em aplicativos que normalmente travariam aguardando o retorno do kernel, o que nunca acontecerá.

Responder2

Ajudará se você usar autofs, uma montagem suave e um valor de tempo curto no cliente.

Responder3

As respostas acima são excelentes do ponto de vista do cliente, mas você também deve pensar no lado do servidor.

Em nosso ambiente, estamos usando um servidor NFS para compartilhar conteúdo da web entre diversas máquinas. As máquinas também usam pacemaker/openais para descobrir quem deve ter o processo do servidor NFS em execução, o volume fibre channel montado e o endereço IP do servidor NFS.

Quando precisamos reinicializar uma máquina, o pacemaker detecta isso e move o servidor NFS ativo para outro nó para que os serviços não sejam interrompidos.

informação relacionada