在裝有 Windows 2008-R2 的 HP 伺服器中。有一個帶有 4 個 SATA 磁碟的 PCI Silicon Image SATA raid 控制器。控制器中的配置使它們處於 Raid5 配置中。 Windows 將它們視為 1 個磁碟機。
今天早上重新啟動伺服器時,其中一個驅動器正在「跳躍」(機械)。噪音過後,螢幕顯示 RAID 中的磁碟遺失了。 (這是一個錯誤的結論)
當硬體重新啟動時,這次引擎蓋打開,「丟失」的磁碟是唯一一個具有機械振動的磁碟。 (得出錯誤結論的原因)。繼續啟動時,系統顯示 4 個設備,但沒有 raid 磁碟區。
我擔心跳盤正在「保留」raid 卷的連接。 SATA 是熱插拔的,所以我從 raidcontroller 上取下了「errordisk」。軟體直接產生「設備遺失」事件。邏輯性強。我重新連接它。當我連接時,我發現我斷開了錯誤的驅動器。不是錯誤磁碟,而是健康磁碟。我對錯誤磁碟重複該過程。就在這時,我又聽到了聲音,順著我的耳朵看去。 「跳動」來自HP陣列中的備用磁碟。發現錯誤的結論
當我再次重新啟動系統時,沒有 raid 磁碟區。我進入控制器“BIOS”。在那裡,選擇是有限的。我看到 4 個設備正在工作,並且我看到了 4 個磁碟上的 raid5 集的配置。回到 Windows,我啟動該軟體。我看到 1 個磁碟處於活動狀態,但不再是 raid5 的一部分。其餘的都有現有的突襲集。 (見圖)系統告訴我所有 4 個磁碟均運作狀況良好。系統告訴我有一個 raid5 設定超過 3 個磁碟。但重建按鈕是灰色的。當我嘗試「轉換舊版 raid 群組」時,出現錯誤。
我可以嘗試做什麼來重建磁碟區而不丟失資料?
更新 1:現有備份不夠新且不完整。資料可以從其他地方獲取,但是重建會花費大量時間且不完整。將伺服器更新到新版本是一個持續的討論,這一舉動會對不同層級使用伺服器的人產生影響。他們知道他們需要這樣做,但他們正在拖延。
答案1
檢查控制器告訴您故障的故障磁碟的序號,並在伺服器關閉時進行驗證,然後再重新啟動伺服器。
當硬體重新啟動時,這次引擎蓋打開,「丟失」的磁碟是唯一一個具有機械振動的磁碟。 (得出錯誤結論的原因)。當繼續啟動時,系統顯示 4 個設備,但沒有 raid 磁碟區。
遺憾的是,在粗體文字後您執行的所有復原步驟都是徒勞的,因為第一次重新啟動時,RAID 陣列似乎已從控制器中刷新。
請記住,在正常使用情況下,驅動器可能會發出滴答聲並發出噪音。這不是檢測故障驅動器的主要因素。下次如果控制器告訴帶有 s/n X 的磁碟出現故障,請使用它來查找它。如果旁邊的磁碟發出令人畏縮的聲音,您可以假設您的陣列也可能很快就會失敗,特別是在 raid5 設定中,您只能讓一個成員離線。可悲的是,畏縮的聲音是一個警告,請確保你附近有備份。
我的建議是從備份中恢復數據,並可能放棄有故障的控制器,同時升級到支援的作業系統。