我的 4 個 Xeon E7 的性能低於單一第 8 代 i5

Question

您的問題（與大多數機器學習問題一樣）可能與記憶體頻寬有關。

機器學習並不是特別需要 CPU 運算密集型，它們會進行大量「簡單」運算，但受到記憶體頻寬的嚴重限制。這就是顯示卡流處理器如此出色的原因之一。每個流處理器相對有限（與 CPU 相比），但對於更簡單的操作，其龐大的頻寬和處理器的絕對數量足以彌補其限制。

隨機選一個第八代i5：

Max Memory Bandwidth    41.6 GB/s

CPU老大似乎顯示第一代 E7-4820 的記憶體頻寬為 23GB/s (23,464 MB/s)

多處理器機器需要不斷地在 CPU 之間複製內存，或以其他方式從一個 CPU 到另一個 CPU 共享對內存的存取。

共享記憶體和顯著降低的頻寬的結合可能是損害舊系統的原因。

較新的 Xeon 聲稱頻寬高達 85GB/s。

Answer 1