我有一台 DL580 G7,安裝了四個 E7 4870 和 128GB RAM(八個盒帶,每個盒帶 2 個 8GB)。作業系統是Ubuntu 18.04。 pcie16 上有一個 TITAN X,並且安裝了必需的 p410i,但沒有其他週邊設備。當我對這個系統進行基準測試時,我得到了它應該提供的大約 50% 的性能。例如這是一個參考基準DL580G7 的 CPU 稍弱 (E7 4850) 和其他類似的設定。
然而,我的系統在相同的基準測試中只能產生一半的效能(我的 CPU 效能約為 980,多核心效能為 20,000)。這似乎不對。
基準測試顯示了所有 80 個核心和 128GB RAM,因此硬體被正確識別。
我已經查看了 HP 的低延遲調整清單並相應地更改了 BIOS。 ILO3 中的電源設定均處於最大效能。
Ubuntu 被設定為所有 80 個核心的「效能」調節器。
我注意到,即使我將系統置於高壓力下(例如在100% CPU 使用率的情況下在所有80 個核心上處理數字數小時),CPU 的熱量也幾乎沒有變化(它們保持在40 度) ,而且風扇也不會旋轉完全沒有(他們保持在 40%)。 ILO3 中顯示的總功耗高達 650 瓦,但我預計在壓力條件下會更接近 1 千瓦。我對此有點困惑。
我已經嘗試過不同的 BIOS 版本。原始 BIOS 是 07/01/2013,這也為其他用戶帶來了效能問題(此類報告可以在網路上找到)。所以我將其降級到 12/03/2012,問題仍然存在。
另外,當我將這台機器的性能與我以前的機器(具有i5 4460)進行比較時,我注意到我的應用程式的單核性能下降了四倍(在非IO 密集型的事情上,例如添加大量向量),這與基準測試的結果一致,但單核性能下降兩倍是我所期望的。我只在乎CPU效能。據我所知,RAID 運作良好,IO 符合預期(但也可能由於 CPU 效能下降而受到影響)。
當我cat /proc/cpuinfo
在壓力期間執行 a 操作時,我看到 CPU 的運行頻率為 2.2Ghz。
到目前為止,我還沒有測試不同的作業系統。一旦我有機會重新啟動機器,我就會這樣做。
答案1
答案2
我很懷念在伺服器故障上看到這樣的問題......但同時,這不是一個常見的請求。
伺服器是一個舊的架構。您所做的一些假設可能會導致您走上錯誤的道路。
我的建議:
您不應僅依賴 HP 低延遲調整指南中建議的功能。這適用於演算法交易等專門應用程序,其目標是確定性和可預測的資源利用率。即時效能特性和低延遲不一定意味著快點。
我會查看 CPU 的功能並從那裡開始工作...
英特爾至強 E7-4870
2011 年推出,2015 年停產。
這是一款支援 Turbo Boost 的 CPU。最大睿頻頻率為 2.80GHz。當您使用“HP靜態高效能模式”等固定設定時,它實際上禁用了睿頻加速。在這種情況下,您最好在您的 Linux 風格下使用作業系統控制模式。 (我也推薦這個用於VMware系統!)
在您的作業系統中,查看是否可以安裝powertop
和turbostat
.
在計算運行期間監視其中之一或兩者。
我很驚訝您正在查看 CPU 溫度或功耗。我從未用它來衡量伺服器正在做什麼。你什麼是使用 Ubuntu(HP ProLiant 硬體通常不支援)缺少作業系統和 ILO 管理處理器之間的互動。這是 ProLiant 設備的增值之一。對於裸機系統,由於硬體監控和運行狀況集成,我嘗試使用類似 RHEL/CentOS 的作業系統。
另外,返回最新的 BIOS 版本。很少有理由降級惠普系統韌體。請同時確保您的 ILO3 韌體是最新的。
答案3
XEON E7-4870 CPU 包含 10 個實體核心。 (https://ark.intel.com/products/53579/Intel-Xeon-Processor-E7-4870-30M-Cache-2-40-GHz-6-40-GT-s-Intel-QPI-) 此伺服器/CPU 配置僅包含 40 個核心,而不是所述的 80 個核心。您是否可能混淆了核心和執行緒?此外,此 CPU 只能在 4 個活動核心的情況下達到 2.8 GHz 的最高時脈頻率。因此,2.8 GHz 時共有 16 個核心,而 2.4 GHz 時共有 40 個核心。
DL580 G7 的記憶體配置也需要考慮。此系統可實現的最高記憶體頻寬(優化的半球模式https://support.hpe.com/hpsc/doc/public/display?docId=c02283239#N100AB)需要 64 個四列 DIMM。
我知道我的答案已經太晚了,但可能會對未來的搜尋者有所幫助;而且我沒有發表評論的聲譽。
答案4
一連串問題都出現了,昨晚我終於找到解決方案了!降級 ROM 和將電源調節器設定為作業系統控制的組合有效。 ** 最初,此(二手)伺服器安裝了錯誤的 BIOS 07/01/2013(請參閱[https://blog.netnerds.net/2014/02/solved-degraded-performance-on-hp-dl580-g7-on-bios-v-7012013/]),這使得 ROM 上的功率調節設定的任何變更都無效。 ** 即使系統只提供 50% 的效能,「cat /proc/cpuinfo」傳回每個核心 2,2ghz 的速度(略低於最大值 2,4,但遠未達到 50%) )。此結果與 Turbostat 等其他工具報告的結果一致。確實很奇怪,這個事實增加了我的困惑。 * 我嘗試在 Linux 啟動時禁用 c-states,但這沒有幫助(不是更好,也不是更糟)。 * 最後,我現在在單核 Geekbench 上獲得 2100 分,在多核心 Geekbench 上獲得 36,000 分。這與禁用超線程差不多。我想,經過一些耐心的調整,多核心 Geekbench 應該可以突破 40,000 大關,但目前我已經很滿意了。
真正讓我惱火的是,所有 cpu 工具報告的核心速度至少為 2.2ghz,但我的系統卻慢得令人痛苦。我認為這一定是 07/01/2013-ROM 的奇怪錯誤。我同意將 ROM/ILO 韌體升級到最新版本是最好的,但我還沒有時間認真嘗試。