Veeam Repository로 사용할 Ubuntu 서버(22.04.3 LTS)를 설정했습니다. iSCSI를 통해 NetApp 스토리지의 LUN을 연결하려고 합니다. 서버를 재부팅해야 할 때까지 설정 자체는 문제 없이 진행되었습니다. 재부팅 후 서버는 긴급 프롬프트에서 종료되었고 로그인하여 시스템을 확인한 결과 이상한 점은 발견되지 않았으므로 부팅을 완료했고 모든 것이 정상이었습니다. 문제를 찾기 위해 재부팅했을 때 iSCSI LUN을 마운트하는 데 문제가 있다는 메시지가 표시되었고 다시 긴급 프롬프트에서 종료되었습니다. 이번에는 1~2분 후에 부팅을 완료(Control+D)하라고 계속해서 지시했습니다. 모든 것이 괜찮았습니다. 더 이상 시도해도 추가 정보가 제공되지 않아 로그를 확인하러갔습니다. 내가 찾은 관련 부분은 다음과 같습니다.
부팅 초기에 파일 시스템을 마운트하려고 시도하지만 당연히 실패합니다.
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start timed out.
Jan 29 12:37:42 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for Local File Systems.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Job local-fs.target/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Triggering OnFailure= dependencies.
Jan 29 12:37:42 hwlxve01 systemd[1]: mnt-veeam\x2dhr01.mount: Job mnt-veeam\x2dhr01.mount/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start failed with result 'timeout'.
조금 후에 네트워크가 시작됩니다. 예를 들어
Jan 29 12:37:44 hwlxve01 kernel: ixgbe 0000:03:00.1 enp3s0f1: NIC Link is Up 10 Gbps, Flow Control: RX/TX
그런 다음 iSCSI가 로그인을 시작합니다.
Jan 29 12:38:01 hwlxve01 systemd[1]: Starting Login to default iSCSI targets...
90초 후에는 시간 초과가 발생합니다.
Jan 29 12:39:31 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:39:31 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
이 오류가 몇 번 나타납니다.
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: Could not login to [iface: iscsi02, target: iqn.1992-08.com.netapp:sn.c45dccd4641511ee880bd039eaaae634:vs.7, portal: 192.168.114.3,3260].
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: initiator reported error (20 - could not connect to iscsid)
만세, Emergency Shell로 이동합니다
Jan 29 12:42:34 hwlxve01 systemd[1]: Started Emergency Shell.
Jan 29 12:42:34 hwlxve01 systemd[1]: Reached target Emergency Mode.
몇 초 후에 모든 경로에 성공적으로 연결할 수 있습니다.
Jan 29 12:42:35 hwlxve01 systemd[1]: Started iSCSI initiator daemon (iscsid).
Jan 29 12:42:35 hwlxve01 kernel: Loading iSCSI transport class v2.0-870.
Jan 29 12:42:35 hwlxve01 kernel: iscsi: registered transport (tcp)
Jan 29 12:42:35 hwlxve01 kernel: scsi host11: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi host12: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: Direct-Access NETAPP LUN C-Mode 9131 PQ: 0 ANSI: 5
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: supports implicit TPGS
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: device naa.600a098038314c6f445d565238477871 port group 3e9 rel port 6
Jan 29 12:42:35 hwlxve01 kernel: sd 11:0:0:0: Attached scsi generic sg2 type 0
다중 경로가 해당 작업을 수행합니다.
Jan 29 12:42:36 hwlxve01 multipathd[659]: mpatha: reload [0 176093659136 multipath 3 pg_init_retries 50 queue_if_no_path 1 alua 2 1 service-time 0 1 1 8:16 1 service-time 0 2 1 8:48 1 8:32 1]
좋습니다. iSCSI 로그인에 시간이 걸릴 수 있다는 것은 알지만 이 시간이 이상하게 느껴집니다. 또한 iSCSI 데몬 연결 오류가 발생하는 이유는 무엇입니까?
어떡해?
추가 로그가 필요한 경우 알려주시기 바랍니다.
몇 가지 유사한 설정을 구축했지만 비슷한 문제가 발생하는 곳은 없습니다.