網路檔案系統在高 I/O 速度期間失敗

Question

多年來學到的一些建議。

設定 NFS 導出選項：async,insecure,no_subtree_check

設定 NFS 掛載選項soft,noatime,nodiratime,nolock,vers=3

也設定：noatime,nodiratime在 data/tmp/scratch 安裝上。確保 NFS 加密已關閉以減少負載。停止 NFS 鎖定進程。

嘗試在所有主機上為網路啟用 JUMBO 幀（如果網路設備支援） - 將 MTU 設定為 9k 左右。
確保使用 raid10 儲存（不惜一切代價避免 raid5/6）進行隨機寫入 IO。有SSD嗎？
最大化開啟的 FS 句柄數（某些系統上預設為 2K），設定為 1M 左右。
是否有機會將帶有輸入資料的映射資料庫複製到本地臨時節點存儲，然後將生成的 sam 檔案組合/排序作為單獨的步驟？
增加已處理區塊的大小（因此處理時間至少為 30 分鐘或更長。
如果可能的話盡可能在最高層級上拆分工作（嘗試在 10 個不同節點上並行映射/排序 10 個獨立的基因組/樣本，而不是嘗試使用 10 個主機串聯映射每個基因組）。所有進程完成後嘗試檢查點。
修改程式來源，使其讀取更大區塊的資料 - 例如 1M 而不是 4k。
請注意 CPU/RAM 互連爭用（尤其是在 AMD 4-8 插槽系統上），有時在 48 核心機箱上運行 12-24 執行緒比 48 執行緒快得多。嘗試不同的利用率等級。確保 NUMA 已開啟並針對多 CPU 系統進行設定。在啟用 NUMA 的情況下重新編譯。

PS：管理一個高效的集群類似於規劃/管理一個擁有超過 1000 名工人的建築工地...

Answer 1

多年來學到的一些建議。

設定 NFS 導出選項：async,insecure,no_subtree_check

設定 NFS 掛載選項soft,noatime,nodiratime,nolock,vers=3

也設定：noatime,nodiratime在 data/tmp/scratch 安裝上。確保 NFS 加密已關閉以減少負載。停止 NFS 鎖定進程。

嘗試在所有主機上為網路啟用 JUMBO 幀（如果網路設備支援） - 將 MTU 設定為 9k 左右。
確保使用 raid10 儲存（不惜一切代價避免 raid5/6）進行隨機寫入 IO。有SSD嗎？
最大化開啟的 FS 句柄數（某些系統上預設為 2K），設定為 1M 左右。
是否有機會將帶有輸入資料的映射資料庫複製到本地臨時節點存儲，然後將生成的 sam 檔案組合/排序作為單獨的步驟？
增加已處理區塊的大小（因此處理時間至少為 30 分鐘或更長。
如果可能的話盡可能在最高層級上拆分工作（嘗試在 10 個不同節點上並行映射/排序 10 個獨立的基因組/樣本，而不是嘗試使用 10 個主機串聯映射每個基因組）。所有進程完成後嘗試檢查點。
修改程式來源，使其讀取更大區塊的資料 - 例如 1M 而不是 4k。
請注意 CPU/RAM 互連爭用（尤其是在 AMD 4-8 插槽系統上），有時在 48 核心機箱上運行 12-24 執行緒比 48 執行緒快得多。嘗試不同的利用率等級。確保 NUMA 已開啟並針對多 CPU 系統進行設定。在啟用 NUMA 的情況下重新編譯。

PS：管理一個高效的集群類似於規劃/管理一個擁有超過 1000 名工人的建築工地...

相關內容