
Linux의 AVAGO MegaRAID SAS 9361-8i에서 몇 분 만에 이상한 일련의 디스크 "오류"를 경험했습니다. 이 시간 동안 핫 스페어 드라이브는 가동되지 않았습니다. 관련되지 않은 몇 가지 JBOD 드라이브(괜찮아 보이는)를 무시하고 정의된 DG는 RAID6이었습니다. 세 번째 디스크에 오류가 발생하면 DG가 오프라인 상태가 되었습니다. 디스크가 너무 빨리 고장나기 때문에 실제 문제는 아닌 것 같습니다. 나는 아마도 DG를 복구하려고 노력할 수 있을 것이라고 생각했습니다.
장치를 재부팅했는데 이제 디스크가 "외부"로 표시됩니다.
Drive Information :
=================
-----------------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
-----------------------------------------------------------------------------------
23:0 24 GHS - 3.637 TB SATA HDD N N 512B WDC WD4000FYYZ-01UL1B1 D -
23:1 31 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:2 25 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:3 30 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:4 26 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:5 29 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L0 U -
23:6 27 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:7 33 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:8 28 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:9 32 UGood F 3.637 TB SATA HDD N N 512B WDC WD4000F9YZ-09N20L1 U -
23:10 42 JBOD - 3.638 TB SATA HDD N N 512B WDC WD40EFRX-68N32N0 U -
23:11 41 JBOD - 3.638 TB SATA HDD N N 512B WDC WD40EFZX-68AWUN0 U -
23:18 39 JBOD - 1.819 TB SATA HDD N N 512B Hitachi HDS722020ALA330 U -
23:23 40 JBOD - 3.638 TB SATA HDD N N 512B WDC WD40EFZX-68AWUN0 U -
-----------------------------------------------------------------------------------
왜 "외국인"으로 표시되어 있는지 모르겠습니다. 디스크를 이동, 추가 또는 제거하지 않았습니다.
미리보기:
# /opt/MegaRAID/storcli/storcli64 /c0/fall import preview
CLI Version = 007.1705.0000.0000 Mar 31, 2021
Operating system = Linux 3.10.0-1160.25.1.el7.x86_64
Controller = 0
Status = Success
Description = Operation on foreign configuration Succeeded
FOREIGN PREVIEW :
===============
----------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type State BT Size PDC PI SED DS3 FSpace TR
----------------------------------------------------------------------------
0 - - - - RAID6 OfLn N 25.466 TB dflt N N dflt Y N
0 0 - - - RAID6 Dgrd N 25.466 TB dflt N N dflt Y N
0 0 0 23:9 32 DRIVE Offln N 3.637 TB dflt N N dflt - N
0 0 1 23:1 31 DRIVE Onln N 3.637 TB dflt N N dflt - N
0 0 2 23:2 25 DRIVE Onln N 3.637 TB dflt N N dflt - N
0 0 3 23:3 30 DRIVE Onln N 3.637 TB dflt N N dflt - N
0 0 4 23:4 26 DRIVE Onln N 3.637 TB dflt N N dflt - N
0 0 5 23:5 29 DRIVE Onln N 3.637 TB dflt N N dflt - N
0 0 6 23:6 27 DRIVE Offln N 3.637 TB dflt N N dflt - N
0 0 7 23:7 33 DRIVE Onln N 3.637 TB dflt N N dflt - N
0 0 8 23:8 28 DRIVE Offln N 3.637 TB dflt N N dflt - N
----------------------------------------------------------------------------
DG=Disk Group Index|Arr=Array Index|Row=Row Index|EID=Enclosure Device ID
DID=Device ID|Type=Drive Type|Onln=Online|Rbld=Rebuild|Optl=Optimal|Dgrd=Degraded
Pdgd=Partially degraded|Offln=Offline|BT=Background Task Active
PDC=PD Cache|PI=Protection Info|SED=Self Encrypting Drive|Frgn=Foreign
DS3=Dimmer Switch 3|dflt=Default|Msng=Missing|FSpace=Free Space Present
TR=Transport Ready
Total foreign Drive Groups = 1
가져오려고 하면 다음 오류와 함께 실패합니다.
# /opt/MegaRAID/storcli/storcli64 /c0/fall import
CLI Version = 007.1705.0000.0000 Mar 31, 2021
Operating system = Linux 3.10.0-1160.25.1.el7.x86_64
Controller = 0
Status = Failure
Description = Incomplete foreign configuration
미리 본 오프라인 드라이브를 강제로 온라인으로 만들려고 했지만 다음과 같습니다.
# /opt/MegaRAID/storcli/storcli64 /c0/e23/s8 set online
CLI Version = 007.1705.0000.0000 Mar 31, 2021
Operating system = Linux 3.10.0-1160.25.1.el7.x86_64
Controller = 0
Status = Failure
Description = Set Drive Online Failed.
Detailed Status :
===============
------------------------------------------------
Drive Status ErrCd ErrMsg
------------------------------------------------
/c0/e23/s8 Failure 255 Operation not allowed.
------------------------------------------------
이는 세 가지 모두에서 발생합니다.
이것을 복구할 수 있는 방법이 있나요? 또한 핫 스페이스 회전으로 인한 갑작스러운 디스크 오류에 대해 들어본 사람이 있습니까?