Pasé 3 noches y parte de días buscando en Google y reconfigurando servidores de la red doméstica con dos servidores nfs vers=3 que de repente dejaron de funcionar.
Estaban trabajando sin problemas usando el montaje automático de 3 a 4 clientes. Esto no es nada productivo, los tengo en casa solo para probar cosas más o menos, pero hay algunas fotos y películas en ZFS en uno u otro servidor.
Nada funcionó de repente y no se logró ningún progreso... ni rm /etc/default/nfs-* apt-get purge&install, ni varios intentos de iniciar rpc.mountd o statd y observar su salida... Bueno, pero hay una tercera máquina con nfs3 servidor, un enrutador con OpenWRT que sirve solo una llave USB. Éste funciona sin problemas en todas las PC, independientemente de que esos dos servidores Ubuntu estén muertos. Entonces, sospeché de las actualizaciones de Ubuntu. Encontré que el paquete nfs-utils se eliminó hace unos meses. Y no estaba seguro de cuándo dejó de funcionar.
Síntomas: showmount -e server tarda de 2 a 3 minutos en mostrar la respuesta, pero la respuesta es correcta. rpcinfo -p server tarda alrededor de un minuto o más y muestra el resultado correcto. mount.nfs xx:/x/x /mnt/test -o vers=3 finaliza después de uno o dos minutos con error. ping o montar samba de esos servidores funciona sin problemas, iperf dice alrededor de 1 gigabit como se esperaba (o menos, pero sigue siendo bueno cuando el cliente usa wifi). telnet al puerto portmapper y al puerto nfs abre una sesión. El cortafuegos está desactivado. Incluso se agregó TODO: lanip a Hosts.allow. - Todos los problemas afectan solo a los servidores Ubuntu, OpenWrt responde en una fracción de segundo y funciona como se espera de todos los clientes. Pero no es compatible con nfs4. - uno de los servidores es 12.04.5 LTS con pila Trusty HWE, - el segundo servidor es 14.04 LTS Trusty. Todas las actualizaciones instaladas. Uno de ellos utiliza enlace NIC (modo0) de dos interfaces, el segundo no.
Razón, sin explicación:
Para acortar un poco la historia, hace unos minutos se me ocurrió una idea loca para probar y cambié mi nuevo conmutador administrado ZyXel GS1900-8 por un viejo y barato (pero también gigabit) tplink. Y me volví loco cuando mis servidores NFS comenzaron a funcionar en ese momento.
Mirando el interruptor, no tengo idea de qué le pasa. Ahora recuerdo que habilité LLTP e instalé lltpd en todas las PC, solo para divertirme viendo su nombre en la lista de puertos. E hice algunas pruebas de vinculación usando 803.ad LACP que no era compatible con el conmutador anterior y está funcionando en uno nuevo, pero lo apagué (de vuelta al modo 0) porque evitaba WoL que estoy usando regularmente y considero necesario. ..
Por favor, dígame qué comprobar o adivine cuál podría ser el motivo. ¿Dónde buscar y qué comandos intentar encontrar la diferencia? Sentí mucha curiosidad.
Respuesta1
Termina descubriendo que los conmutadores administrados con función DoS (denegación de servicio) habilitan, detectan solicitudes de mapa de puertos SYN<1024 y comienzan a bloquearlas. Desactivar esta función resuelve el problema por completo.
No puedo detectar el problema más que intentar rpcinfo -p o showmount -e, porque todos los puertos son accesibles cuando intento solo telnet.
Google encontró mensajes comunes, después de que ya sé qué buscar, por ejemplohttps://serverfault.com/questions/367107/cant-mount-nfs-share-over-tcp Y se mencionan diferentes marcas de switch (los míos son ZyXel, su PoweConnect y también Cisco).
En mi humilde opinión, dado que los conmutadores administrados se están volviendo baratos y comunes, este problema puede reaparecer muchas veces y tal vez sea la razón de otros problemas de nfs mencionados en Askubuntu.