攝取率大的服務如何足夠快地安裝足夠的硬碟?

攝取率大的服務如何足夠快地安裝足夠的硬碟?

亞馬遜、Facebook 和Google每天的收入必須是TB 級(如果不是PB 級),這是否意味著他們會讓人不斷地在新機架中安裝新硬碟和電纜,就像建立常規伺服器一樣,或者是否使用了不同的技術用於集體連接驅動器?

答案1

我不知道他們是否真的一次為一台伺服器安裝硬體。早在2008年MS 開始建立其資料中心,方法是將伺服器裝在密封且預先接線的伺服器集裝箱中交付,他們只需從卡車上卸下這些伺服器,然後插入電源/網路連接即可。雖然 08 版本是容器和傳統的混合體,但最近的版本資料中心從那以後,他們採用了客製化的預製設計,這種設計可以防風雨,並且不需要安置在單獨的建築物內。

兩個都惠普和IBM銷售類似的軟體包,其中包含裝滿伺服器的預先建置容器,只需電源/資料連接即可部署。

微軟維吉尼亞州博伊登資料中心的預製模組暴露在惡劣天氣下。

答案2

谷歌擁有多種內部開發的技術來儲存這些大量資料。使用這些技術,他們實際上可以將卡車裝載的硬碟添加到他們的集群中,而無需任何停機,但是,是的,他們仍然需要人們這樣做。

據我從 Google 部落格了解到,兩個主要部分是 Google 檔案系統,它是一個可以擴展到非常大的規模的分散式檔案系統:谷歌檔案系統

在 Google 檔案系統之上,他們有 Big Table,它是某種鍵值資料庫,也可以擴展到龐大的規模:大桌子

為了確保高可用性,一切都會冗餘很多次,大多數情況下超過 3 次。

答案3

這是完全正確的。我記得有一次,Facebook 資料中心平均每天要增加三輛裝滿硬碟和機架式伺服器的拖車。當然,他們有複雜的方案來使儲存可擴展和冗餘。以Google為例,政府財政司司長。 Facebook 專門為其設備設立了三個資料中心,每個資料中心都比兩個沃爾瑪還要大,而新的資料中心計劃比現有資料中心大四倍。

答案4

這是BackBlaze 的一篇有趣的部落格文章,介紹了他們如何做到這一點(他們可能不需要像Google 或Facebook 那麼多的磁碟,但仍然需要整個lt),以及當泰國發生洪水導致硬碟損壞時他們需要做什麼昂貴且難以取得:

http://blog.backblaze.com/2012/10/09/backblaze_drive_farming/

相關內容