![Ubuntu サーバーからの iSCSI 接続が起動時にタイムアウトする](https://rvso.com/image/1703354/Ubuntu%20%E3%82%B5%E3%83%BC%E3%83%90%E3%83%BC%E3%81%8B%E3%82%89%E3%81%AE%20iSCSI%20%E6%8E%A5%E7%B6%9A%E3%81%8C%E8%B5%B7%E5%8B%95%E6%99%82%E3%81%AB%E3%82%BF%E3%82%A4%E3%83%A0%E3%82%A2%E3%82%A6%E3%83%88%E3%81%99%E3%82%8B.png)
Veeam リポジトリとして使用するために Ubuntu サーバー (22.04.3 LTS) をセットアップしました。NetApp ストレージ上の LUN を iSCSI 経由で接続したいと考えています。セットアップ自体は問題なく進みましたが、サーバーを再起動する必要がありました。再起動後、サーバーは緊急プロンプトで終了しましたが、ログインしてシステムをチェックしても異常は見つからなかったため、起動を完了し、すべて正常でした。問題を見つけるために再起動すると、iSCSI LUN のマウントに問題があることを示すメッセージが表示され、再び緊急プロンプトで終了したとき、今度は 1 ~ 2 分後に起動を完了するように指示しました (Control+D)。再び、すべて正常でした。さらに試行しても詳細情報が得られなかったため、ログを確認しました。以下は、私が見つけた関連部分です。
起動時にファイルシステムをマウントしようとするが、当然失敗する。
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start timed out.
Jan 29 12:37:42 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
Jan 29 12:37:42 hwlxve01 systemd[1]: Dependency failed for Local File Systems.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Job local-fs.target/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: local-fs.target: Triggering OnFailure= dependencies.
Jan 29 12:37:42 hwlxve01 systemd[1]: mnt-veeam\x2dhr01.mount: Job mnt-veeam\x2dhr01.mount/start failed with result 'dependency'.
Jan 29 12:37:42 hwlxve01 systemd[1]: dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device: Job dev-disk-by\x2duuid-5e252ca3\x2d9f19\x2d4a9c\x2d946d\x2d4cd4e02d29ff.device/start failed with result 'timeout'.
少し遅れてネットワークが立ち上がる。例えば
Jan 29 12:37:44 hwlxve01 kernel: ixgbe 0000:03:00.1 enp3s0f1: NIC Link is Up 10 Gbps, Flow Control: RX/TX
iSCSIがログインを開始します
Jan 29 12:38:01 hwlxve01 systemd[1]: Starting Login to default iSCSI targets...
90秒後にタイムアウトが発生します
Jan 29 12:39:31 hwlxve01 systemd[1]: Timed out waiting for device /dev/disk/by-uuid/5e252ca3-9f19-4a9c-946d-4cd4e02d29ff.
Jan 29 12:39:31 hwlxve01 systemd[1]: Dependency failed for /mnt/veeam-hr01.
このエラーは数回発生します:
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: Could not login to [iface: iscsi02, target: iqn.1992-08.com.netapp:sn.c45dccd4641511ee880bd039eaaae634:vs.7, portal: 192.168.114.3,3260].
Jan 29 12:39:32 hwlxve01 iscsiadm[986]: iscsiadm: initiator reported error (20 - could not connect to iscsid)
そしてやった、緊急シェルへ
Jan 29 12:42:34 hwlxve01 systemd[1]: Started Emergency Shell.
Jan 29 12:42:34 hwlxve01 systemd[1]: Reached target Emergency Mode.
そして数秒後にはすべてのパスで正常に接続できるようになります
Jan 29 12:42:35 hwlxve01 systemd[1]: Started iSCSI initiator daemon (iscsid).
Jan 29 12:42:35 hwlxve01 kernel: Loading iSCSI transport class v2.0-870.
Jan 29 12:42:35 hwlxve01 kernel: iscsi: registered transport (tcp)
Jan 29 12:42:35 hwlxve01 kernel: scsi host11: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi host12: iSCSI Initiator over TCP/IP
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: Direct-Access NETAPP LUN C-Mode 9131 PQ: 0 ANSI: 5
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: supports implicit TPGS
Jan 29 12:42:35 hwlxve01 kernel: scsi 11:0:0:0: alua: device naa.600a098038314c6f445d565238477871 port group 3e9 rel port 6
Jan 29 12:42:35 hwlxve01 kernel: sd 11:0:0:0: Attached scsi generic sg2 type 0
そしてマルチパスは機能する
Jan 29 12:42:36 hwlxve01 multipathd[659]: mpatha: reload [0 176093659136 multipath 3 pg_init_retries 50 queue_if_no_path 1 alua 2 1 service-time 0 1 1 8:16 1 service-time 0 2 1 8:48 1 8:32 1]
わかりました。iSCSI ログインには時間がかかることはわかっていますが、これほど長いのはおかしいと思います。また、iSCSI デーモン接続エラーが発生するのはなぜですか?
私に何ができる?
さらにログが必要な場合はお知らせください。
同様のセットアップをいくつか構築しましたが、同様の問題はどこにも発生していません。