
CPU 的選擇如何影響商品伺服器群的能源預算?我想知道 Facebook、Twitter 等商品伺服器每年的供電成本是多少。使用。
讓我們以一台這樣的典型伺服器(Intel Xeon 處理器 X5650)為例,以及所有 12 個核心均以 90% 的容量運作的典型負載。
每年的耗電量是多少?除了上述場景之外,還需要做哪些假設?對於以上述規模運作的公司來說,這將花費多少成本?冷卻怎麼樣。這樣的伺服器需要多少錢才能冷卻?
如果負載減少到 45%,電力和冷卻成本會下降多少比例?
答案1
你原來的問題是完全太寬泛了,因為甚至無法對實際美元進行粗略估計,因為有只是涉及太多變數(數十萬)。我什至不打算嘗試得出一個數字。相反,我只想討論託管成本的一個特定方面:CPU。
CPU!
CPU 運作成本取決於重重地於世代伺服器的。
經過世代我的意思是,大約是處理器發布的時間,但更重要的是,它是基於什麼架構。
隨著處理器變得更加複雜和先進,它們也開發了更複雜的電源管理功能。讓我們來看看英特爾處理器電源管理的演變,並記住所有功能都是累計隨著時間的推移,這意味著如果某個功能存在於較舊的處理器中,它也可能存在於較新的處理器中,但它可能會在較新的處理器中改進或更高效。
舉一個極端的例子,如果您要查看一個非常舊的伺服器晶片,例如奔騰 II 至強,您可能會注意到規格表沒有提及任何有關節能技術的內容。該晶片幾乎始終使用其最大 TDP。
有點新的東西(但仍然很舊 - ~2005 年),例如至強3.80E比奔騰 IV 更新但比「酷睿」架構更老的架構,開始顯示出英特爾意識到節能的跡象:產品資料表中列出了「英特爾 SpeedStep 技術」。
跳到基於 Core2 微架構的 Xeon (~2008),如下圖所示X5365,你會注意到幾件事:
該CPU有空閒狀態省電功能,這意味著當它不主動執行任何操作時,它可以進入較低功耗模式,即「關閉電源」和「完全運作」之間的某個點。它每秒可以切換空閒狀態數十或數百次,從而實現大量非常「細粒度」的節能。
我們之前看到的 SpeedStep 技術現在是增強型SpeedStep技術,粒度更細,這意味著CPU可以下降到完全適合當前工作負載的特定電壓,並且如果工作負載增加或減少,它可以根據情況調整風扇速度以及CPU的功耗工作負載發生變化(即使工作負載每秒波動一次以上)。
從核心微架構開始,我們開始看到英特爾銷售的至強處理器帶有“L”前綴,代表“低電壓”。這些處理器的熱設計功耗 (TDP) 較低,這意味著與耗電較高的同類處理器相比,它們能夠始終以較低的能耗運作(主要是在較低電壓下運作)。這些零件作為一個選項,因為如果使用普通的耗電部件(前綴為“E”或“X”),您可以獲得稍微更高的性能。
採用英特爾按需切換技術。引用英特爾網站:
英特爾® 按需切換是一種電源管理技術,其中微處理器的應用電壓和時脈速度保持在最低必要水平,直到需要更多處理能力。該技術作為英特爾 SpeedStep® 技術引入伺服器市場。
跳到基於 Nehalem 微架構的 Xeon,如下圖所示X3480,你會注意到幾件事:
英特爾睿頻加速技術;這款 CPU 大部分時間都會以非常節能(每瓦性能出色)的速度運行,但如果 CPU 的利用率峰值非常高,它就能夠超過正常的 TDP(功耗增加和效率降低)以提供更多「Turbo ”模式下的性能。
超線程;這意味著您可以運行四個具有高性能的核心靠近八核心的性能如何,但效率非常高。超線程既是節省成本又省電的機制,讓您獲得更好的體驗每瓦性能(與處理器相比,您投入相同的能量,但獲得更高的性能沒有超線程)。
向前跳到 Westmere(Nehalem-C 又名 Nehalem 的收縮者)至強X5650,這就是您在問題中詢問的問題,這種情況在功耗方面與上面的原始 Nehalem 基本相同,只是您的功耗會稍微降低,因為製造尺寸較小。
現在,在 Westmere/Nehalem 之後,我們有三更多的微架構可以讓我們走到今天:
- Sandy Bridge,2011 年,具有新微架構(又稱「tock」)的 32nm 處理器系列;
- Ivy Bridge,2012,基於 Sandy Bridge 微架構的 22nm 處理器系列,但具有更低的功耗和更好的能源效率(又稱「tick-plus」);
- Haswell,2013,具有新微架構(又稱「tock」)的 22nm 處理器系列。
每一代處理器都為我們提供了更好的電源管理功能,因為這是英特爾目前的主要關注領域之一,原因如下:
- 他們推出的 x86 平板電腦電池容量非常小,需要高能源效率的處理器。
- 資料中心希望降低能源以及暖氣和冷氣成本。
- 隨著普通桌上型電腦使用者不再需要越來越多的運算能力,他們可以開始透過使用更有效率的處理器來降低能源成本、熱量輸出等,這些處理器提供更適度的效能改進,但顯著減少功耗。
隨著處理器內部變得越來越複雜,複雜的邏輯和電路就有了更多的空間,可以準確計算有效提供當前工作負載所需的功率,同時將浪費保持在絕對最低限度。英特爾在最近幾代 CPU 中對該技術進行了大量投資。
Sandy Bridge 低壓 Xeon,例如E3-1260L, 是相當高效,同時也是具有超線程的四核。它的 45 瓦 TDP 不應被視為速度慢的指標;事實並非如此——它甚至比幾年前的 105 W TDP 處理器快得多。
Ivy Bridge 低壓 Xeon,例如E3-1265L v2,甚至比 1260L 更有效率,TDP 仍為 45 瓦,但性能顯著提高,並且 CPU 上的電壓調節器可實現極快的電壓變化響應。
Haswell 低壓 Xeon,例如E3-1265L v3,是目前市場上能源效率方面的巔峰之作,TDP 仍為 45 瓦,但性能更好,更省電。
當然,除了低電壓類別之外,最近的系列中也有更高性能的至強處理器,例如beastly15核E7-8890 v2,將於 2014 年第一季度發布,非常高端,TDP 為 155 瓦(對於 CPU 來說非常大)——最大的區別在於,有了所有這些高端內核,該處理器可以做很多不僅僅是一個低壓晶片。
總體而言,您的X5650 與當前一代相比已經下降了四代(順便說一句,它只有6 個超線程核心,而不是12 個核心),將與商品級四核“E3”品牌Xeon 等產品相媲美來自 Ivy Bridge 或 Haswell 世代,儘管它有更多的核心。較舊的X5650 相比,較新的CPU 具有更高的時脈頻率、更多的L3 快取、支援更快的RAM,並且更節能,這意味著即使它們的核心數量較少,它們也能夠跟上。
負荷調整對成本的影響
如果負載減少到 45%,電力和冷卻成本會下降多少比例?
好吧,根據我們上面的了解,如果 CPU 是現代 CPU(Sandy Bridge、Ivy Bridge 或 Haswell),那麼電力和冷卻成本很可能會降低僅針對CPU(更不用說主機板、硬碟、記憶體等)可能會下降近似線性減少負載。無論如何,這就是最終目標:如果你想要每秒 X 個指令,它將花費 $YYY;如果你想要每秒 X*10 指令,則成本為 $YYY*10。線性標度可以實現非常可預測的經濟性,這就是英特爾的目標。
當然,老一代的 CPU 甚至沒有接近線性,因為它們僅僅處於閒置狀態就會浪費大量的電量,而且即使它們被充分利用,它們也沒有充分利用可用資源,因為它們缺乏超線程等功能。
試著(非常模糊地)勾勒出如何回答你原來的問題
現在您已經了解了有關 CPU 的所有細節,我將告訴您一個秘密:CPU 並不構成主要網站的大部分營運成本。最大的成本是僱員,設施(房地產、土地、資料中心等),以及冷卻。
為了得出 Facebook 或 Twitter 等網站的「粗略」營運成本,您必須考慮以下因素:
即使他們使用最新的CPU,他們仍然需要支付冷卻電費(顯然,如果外部環境非常寒冷,與夏天保持伺服器冷卻需要花費大量費用相比,費用會更低)。冷卻成本取決於他們是否使用「離網」電力(風能、太陽能)或從公用事業公司購買電力(可能是煤炭或核電等)。具體取決於能源來源、需求量等。
主機板、硬碟、SSD、RAM、冷卻風扇、網路設備、照明、安全設備、員工辦公室等都會消耗額外的能源,而此處產生的成本可能會有所不同瘋狂地取決於操作運作的效率。
設施成本將取決於對安全和安保的重視程度。例如,備用柴油發電機會產生大量成本,包括燃料、發電機正確運行的定期測試、電池組(以在柴油發電機啟動時保持一致的功率)等。電源故障,更容易出現完全停電的情況,但日常營運成本將大幅下降。此外,諸如安全攝影機、武裝警衛、徽章閱讀器等的成本也會上升,如果你真的想嘗試準系統,這些也可以被視為「可選的附加設施」。
您還必須完善你所問問題的定義以便得出準確的數字。例如,維護伺服器硬體和網路的 IT 支援專家是否被視為資料中心營運成本的一部分?編寫軟體的程式設計師是否已計入成本?系統管理員又如何呢?那麼管理者呢?清潔地板和更換燈泡的管理員怎麼樣?他們欠政府的稅金怎麼樣?你在哪裡停止衡量成本?這是你的問題定義的一部分,因為我不是通靈者,也不知道你到底在問什麼,所以我不會嘗試回答任何這些問題。無論如何,其中大多數對於超級用戶來說都是偏離主題的。
說了這麼多,我仍然不會對美元進行任何粗略的估計。你必須根據你對公司的營運程序、電力成本、室外溫度、勞動成本等所做的任何假設,自己弄清楚這一點。