研發異質叢集解決方案

Question 1

同意 @NikitaKipriyanov 的觀點，即您無法將多個系統的資源組合到單一映像中，儘管過去已經有商業產品這樣做，並且它們依靠 infiniband 來降低延遲（恕我直言，它效果不佳）。 Slurm 可以用作調度程序，但您也可以將它用於互動式作業，然後它可以更像是資源管理器。

每個作業可以指定 cpu 核心數量、gpu 數量和類型、記憶體量等。如果需要，可以使用 X11 轉送。

此外，容器在研發環境中也非常有用。您不應該因為看不到它們的實用性而將它們扔掉，但它們並不是解決此問題的方法。

Answer

同意 @NikitaKipriyanov 的觀點，即您無法將多個系統的資源組合到單一映像中，儘管過去已經有商業產品這樣做，並且它們依靠 infiniband 來降低延遲（恕我直言，它效果不佳）。 Slurm 可以用作調度程序，但您也可以將它用於互動式作業，然後它可以更像是資源管理器。

每個作業可以指定 cpu 核心數量、gpu 數量和類型、記憶體量等。如果需要，可以使用 X11 轉送。

此外，容器在研發環境中也非常有用。您不應該因為看不到它們的實用性而將它們扔掉，但它們並不是解決此問題的方法。

Question 2

這是不可能的。

根據您的工作負載，可以將您的工作負載轉換為在多台電腦上運行並在它們之間通訊資料。對於某些問題來說，這是微不足道的，您可以將資料集分割成更小的分割區並並行處理它們。對於其他工作負載來說，這是很困難的。但這需要修改工作負載，而不是作業系統。

Answer

這是不可能的。

根據您的工作負載，可以將您的工作負載轉換為在多台電腦上運行並在它們之間通訊資料。對於某些問題來說，這是微不足道的，您可以將資料集分割成更小的分割區並並行處理它們。對於其他工作負載來說，這是很困難的。但這需要修改工作負載，而不是作業系統。

相關內容