Prueba de escenarios de conmutación por error en nfs

Prueba de escenarios de conmutación por error en nfs

Me gustaría saber qué sucede con las conexiones cuando nfs conmuta por error a otro servidor (drbd). Si tengo un archivo abierto en vim, se bloqueará. Creo que solo a veces vuelve... ¿después de un largo tiempo?

¿Cuáles son algunas formas comunes de saber si bloquea io, cancela conexiones, etc. cuando se produce la conmutación por error?

Entonces esto está usando una IP flotante entre 2 servidores usando nfs con volumen drbd.

Respuesta1

Desde el punto de vista del cliente, si el dispositivo de conmutación por error se implementa lo suficientemente bien, sólo parecerá como si el servidor NFS hubiera desaparecido por un tiempo muy corto y luego regresara. Sin embargo, para evitar perder datos, es posible que desee montar con la opción "sincronizar".

Una forma de ver si un proceso está esperando io es hacer "ps aux" y buscar "D" en la columna "STAT". Una forma común de saber si hay algún problema con algún servidor NFS es estudiar el contenido de los archivos de registro y la salida de "dmesg" y buscar mensajes relacionados con NFS como "nfs: servidor myserver no responde, todavía lo intento".

Una forma de evitar que el procesamiento imposible de eliminar se cuelgue en servidores NFS perdidos es agregar el modificador "intr" al montar NFS. Con ese interruptor al menos podrá eliminar los procesos que esperan servidores NFS que ya no están.

información relacionada