Configuramos un servidor Ubuntu (22.04.3 LTS) para usarlo como repositorio de Veeam. Queremos conectar un LUN en un almacenamiento NetApp a través de iSCSI. La configuración en sí se realizó sin problemas hasta que hubo que reiniciar el servidor. Después del reinicio, el servidor terminó en el mensaje de emergencia, al iniciar sesión y verificar el sistema no se encontró nada inusual, así que completé el inicio y todo estuvo bien. Cuando reinicié para encontrar el problema, los mensajes mostraban que había un problema al montar el LUN iSCSI y cuando nuevamente terminamos en el mensaje de emergencia, esta vez le dije que completara el inicio (Control+D) uno o dos minutos más tarde y nuevamente, todo estuvo bien. Otros intentos no dieron más información, así que fui a revisar los registros. Estas son las partes relevantes que encontré:
Intenta montar el sistema de archivos al principio del arranque, lo que por supuesto falla.
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start timed out.
Jan 29 12:37:42 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for Local File Systems.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Job local-fs.target/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Triggering OnFailure= dependencies.
Jan 29 12:37:42 hwlxve01 systemd[1]: mnt-veeam\x2dhr01.mount: Job mnt-veeam\x2dhr01.mount/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start failed with result 'timeout'.
un poco más tarde aparece la red, por ejemplo
Jan 29 12:37:44 hwlxve01 kernel: ixgbe 0000:03:00.1 enp3s0f1: NIC Link is Up 10 Gbps, Flow Control: RX/TX
entonces iSCSI comienza a iniciar sesión
Jan 29 12:38:01 hwlxve01 systemd[1]: Starting Login to default iSCSI targets...
y 90 segundos después llega a un tiempo de espera
Jan 29 12:39:31 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:39:31 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
este error aparece varias veces:
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: Could not login to [iface: iscsi02, target: iqn.1992-08.com.netapp:sn.c45dccd4641511ee880bd039eaaae634:vs.7, portal: 192.168.114.3,3260].
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: initiator reported error (20 - could not connect to iscsid)
y hurra, va a Emergency Shell
Jan 29 12:42:34 hwlxve01 systemd[1]: Started Emergency Shell.
Jan 29 12:42:34 hwlxve01 systemd[1]: Reached target Emergency Mode.
y unos segundos más tarde puede conectarse exitosamente en todas las rutas
Jan 29 12:42:35 hwlxve01 systemd[1]: Started iSCSI initiator daemon (iscsid).
Jan 29 12:42:35 hwlxve01 kernel: Loading iSCSI transport class v2.0-870.
Jan 29 12:42:35 hwlxve01 kernel: iscsi: registered transport (tcp)
Jan 29 12:42:35 hwlxve01 kernel: scsi host11: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi host12: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: Direct-Access NETAPP LUN C-Mode 9131 PQ: 0 ANSI: 5
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: supports implicit TPGS
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: device naa.600a098038314c6f445d565238477871 port group 3e9 rel port 6
Jan 29 12:42:35 hwlxve01 kernel: sd 11:0:0:0: Attached scsi generic sg2 type 0
y multipath hace su trabajo
Jan 29 12:42:36 hwlxve01 multipathd[659]: mpatha: reload [0 176093659136 multipath 3 pg_init_retries 50 queue_if_no_path 1 alua 2 1 service-time 0 1 1 8:16 1 service-time 0 2 1 8:48 1 8:32 1]
Bien, sé que los inicios de sesión iSCSI pueden llevar tiempo, pero tanto tiempo parece extraño. Además, ¿por qué aparece el error de conexión del demonio iSCSI?
¿Qué puedo hacer?
Si se necesitan más registros, hágamelo saber.
Construí algunas configuraciones similares y en ninguna parte me encuentro con un problema similar.