AWS 上的 Slurm 節點設定為啟動時耗盡

Question

如果尚未設定，請嘗試在 slurm.conf 中設定「ReturnToService=2」。然後重新啟動 slurm 服務。這裡，2的值意味著

使用有效設定註冊後，DOWN 節點將可供使用。該節點可能因任何原因而被設定為“關閉”。如果節點的記憶體、GRES、CPU 數量等等於或大於 slurm.conf 中配置的值，則節點將註冊有效配置。（在 Cray ALPS 系統上停用。）

預設值為 0。

Answer 1

如果尚未設定，請嘗試在 slurm.conf 中設定「ReturnToService=2」。然後重新啟動 slurm 服務。這裡，2的值意味著

使用有效設定註冊後，DOWN 節點將可供使用。該節點可能因任何原因而被設定為“關閉”。如果節點的記憶體、GRES、CPU 數量等等於或大於 slurm.conf 中配置的值，則節點將註冊有效配置。（在 Cray ALPS 系統上停用。）

預設值為 0。

相關內容