啟動時 Ubuntu 伺服器的 iSCSI 連線逾時

啟動時 Ubuntu 伺服器的 iSCSI 連線逾時

我們設定了一個 Ubuntu 伺服器 (22.04.3 LTS) 用作 Veeam 儲存庫。我們希望透過 iSCSI 連接 NetApp 儲存體上的 LUN。設定本身沒有問題,直到伺服器必須重新啟動。重新啟動後,伺服器出現緊急提示,登入並檢查系統沒有發現任何異常,所以我完成了啟動,一切都很好。當我重新啟動以發現問題時,訊息顯示安裝 iSCSI LUN 時出現問題,當我們再次在緊急提示下結束時,這次我告訴它完成啟動 (Control+D) 一兩分鐘後一次又一次,一切都很好。進一步的嘗試沒有提供任何進一步的信息,所以我去檢查日誌。這是我找到的相關部分:

它嘗試在啟動早期掛載檔案系統,當然會失敗

Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start timed out.
Jan 29 12:37:42 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for Local File Systems.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Job local-fs.target/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Triggering OnFailure= dependencies.
Jan 29 12:37:42 hwlxve01 systemd[1]: mnt-veeam\x2dhr01.mount: Job mnt-veeam\x2dhr01.mount/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start failed with result 'timeout'.

稍後網路就會出現,例如

Jan 29 12:37:44 hwlxve01 kernel: ixgbe 0000:03:00.1 enp3s0f1: NIC Link is Up 10 Gbps, Flow Control: RX/TX

然後iSCSI開始登入

Jan 29 12:38:01 hwlxve01 systemd[1]: Starting Login to default iSCSI targets...

90 秒後超時

Jan 29 12:39:31 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:39:31 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01. 

這個錯誤出現了幾次:

Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: Could not login to [iface: iscsi02, target: iqn.1992-08.com.netapp:sn.c45dccd4641511ee880bd039eaaae634:vs.7, portal: 192.168.114.3,3260].
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: initiator reported error (20 - could not connect to iscsid)

萬歲,它轉到緊急殼牌

Jan 29 12:42:34 hwlxve01 systemd[1]: Started Emergency Shell.
Jan 29 12:42:34 hwlxve01 systemd[1]: Reached target Emergency Mode. 

幾秒鐘後,它可以在所有路徑上成功連接

Jan 29 12:42:35 hwlxve01 systemd[1]: Started iSCSI initiator daemon (iscsid).
Jan 29 12:42:35 hwlxve01 kernel: Loading iSCSI transport class v2.0-870.
Jan 29 12:42:35 hwlxve01 kernel: iscsi: registered transport (tcp)
Jan 29 12:42:35 hwlxve01 kernel: scsi host11: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi host12: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: Direct-Access     NETAPP   LUN C-Mode       9131 PQ: 0 ANSI: 5
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: supports implicit TPGS
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: device naa.600a098038314c6f445d565238477871 port group 3e9 rel port 6
Jan 29 12:42:35 hwlxve01 kernel: sd 11:0:0:0: Attached scsi generic sg2 type 0

多路徑發揮作用

Jan 29 12:42:36 hwlxve01 multipathd[659]: mpatha: reload [0 176093659136 multipath 3 pg_init_retries 50 queue_if_no_path 1 alua 2 1 service-time 0 1 1 8:16 1 service-time 0 2 1 8:48 1 8:32 1]

好的,我知道 iSCSI 登入可能需要時間,但這麼長的時間似乎很奇怪。另外,為什麼我會收到 iSCSI 守護程式連線錯誤?

我能做些什麼?

如果需要更多日誌,請告訴我。

我建立了一些類似的設置,但沒有遇到類似的問題。

相關內容