mdadm - 軟體攻擊

mdadm - 軟體攻擊

我設定了一個基於 Ubuntu 11.04 伺服器的小型 raid,並且剛剛收到了來自它的這封電子郵件。我如何驗證或檢查這一點?

理查

這是由運行在 godzilla 上的 mdadm 自動產生的郵件訊息

在 md 裝置 /dev/md/0 上偵測到失敗事件。

它可能與元件裝置 /dev/sda1 有關。

忠於你的,等等。

PS /proc/mdstat 檔案目前包含以下內容:

個性:[線性] [多路徑] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 :主動raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 sdd1[3] sdc1[2] 2927135232 塊超級1. ,512k 區塊,演算法2 [4/3] [_UUU] [>.................................]檢查= 2.2% (21655188/975711744) 完成= 4419.8 分鐘速度=3597K/秒

&> 貓 /proc/mdstat個性:[線性] [多路徑] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 :主動raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 sdd1[3] sdc1[2] 2927135232 塊超級1. , 512k 區塊,演算法 2 [4/3] [_UUU]

未使用的設備:

貓 /proc/mdstat個性 : [線性] [多路徑] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : 主動 raid5sda1[0]Fsdb1[1]sdd1[3] sdc1[2] 2927135232 區塊超級 1.2 5 級,512k 區塊,演算法 2 [4/3] [_UUU]

未使用的設備:

簡訊 [775549.274966] md/raid:md0: sda1 上的磁碟故障,停用裝置。 [775549.274967] md/raid:md0:操作在 3 台裝置上繼續。 [775549.280021] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310408
)。 [775549.280028] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310416
)。 [775549.280031] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310424
)。 [775549.280035] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310432
)。 [775549.280039] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310440
)。 [775549.280043] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310448
)。 [775549.280047] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310456
)。 [775549.280051] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310464
)。 [775549.280055] md/raid:md0: 讀取錯誤無法修正(sda1 上的磁區 43310472
)。 [775549.280226] ata7:EH完成[775549.316567] ata7.00:異常Emask 0x0 SAct 0x0 SErr 0x300000操作0x6 [775549.319133] 79. : { Dispar BadCRC } [775549.324237] ata7.00 :指令失敗:READ DMA EXT [775549.326754] ata7.00: cmd 25/00:f8:28:ed:94/00:03:02:00:00/e0 tag 0 dma 52019
2 in [775549. :48:78:7f:2e/84:00:03:00:00/e0 Emask 0x10(ATA
匯流排錯誤)[7755549.331806] ata7.00:狀態:{ DRDY ERR } [775549.334350] 錯誤:37. ICRC ABRT } [775549.336890] ata7:硬重置連結[775549.336895] ata7:nv:跳過佔用連接埠上的硬重置[775549.340260] md:md0:資料檢查已完成。 [775549.804062] ata7:SATA 鏈接3.0 Gbps (SStatus 123 SControl 300) [775549.844352] ata7.00:配置為UDMA/33 [775549.844390] ata7:EH 完成[775549.936450] RAID conf 打印輸出:[775549 .936456]---等級: 5 rd:4 wd:3 [775549.936460] 磁碟0、o:0、dev:sda1 [775549.936463] 磁碟1、o:1、dev:sdb1 [775549.936465] 1、o:1、dev:sdb1 [775549.936465] dev23:175750750757:750757:750757:750757:75037:75037:7507:75037:75037:707:27:750757:7507:50757:0757:75037:7507:750757:75037; ] 磁盤3、o:1、dev:sdd1 [775549.936557] RAID conf 打印輸出:[775549.936559] --- level:5 rd:4 wd:3 [775549.936562] 磁盤1、o:1、dev:sdb1 [775549.936564]磁碟2、 o:1,dev:sdc1 [775549.936567] 磁碟 3,o:1,dev:sdd1

sudo mdadm --detail /dev/md0

/dev/md0:版本:1.2 建立時間:2005 年1 月1 日星期六14:43:44 RAID 等級:raid5 陣列大小:2927135232 (2791.53 GiB 2997.39 GB) 所使用的開發大小:97571174設備:總共4 個設備:4 持久性:超級塊是持久性的

Update Time : Sun Feb  5 19:17:41 2012
      State : clean, degraded  Active Devices : 3 Working Devices : 3  Failed Devices : 1   Spare Devices : 0

     Layout : left-symmetric
 Chunk Size : 512K

       Name : godzilla:0  (local to host godzilla)
       UUID : 7c2be5e4:25e338e5:b575b8cd:83896caf
     Events : 657

Number   Major   Minor   RaidDevice State
   0       0        0        0      removed
   1       8       17        1      active sync   /dev/sdb1
   2       8       33        2      active sync   /dev/sdc1
   3       8       49        3      active sync   /dev/sdd1

   0       8        1        -      faulty spare   /dev/sda1

答案1

我會查看“dmesg”的輸出以及檔案 /var/log/syslog。可能會出現 /dev/sda1 問題的提示。

硬碟可能已經崩潰,但也可能只是電纜沒有插入好(SATA 電纜只是......不是那麼好)。查看裝置是否仍然在線,也許可以使用不同的名稱(例如 /dev/sde1 或系統中的下一個可用名稱)來使用它。如前所述,我也會檢查 dmesg/syslog、SMART。也許電纜只需正確插入或必須更換。在大多數情況下,您可以將磁碟重新新增至 RAID 陣列 - 如果問題確實與損壞的電纜或類似的問題有關,即沒有「真正的」硬碟故障,我只會使用這些命令。

mdadm --fail /dev/mdX /dev/sdX # set the disk faulty
mdadm -r /dev/mdX /dev/sdX # remove faulty disk
mdadm --re-add /dev/mdX /dev/sdX # re-add disk

免責聲明:不保證,您應該有備份,這將重建您的 RAID 陣列 - 那時沒有冗餘等。

相關內容