CentOS 8, Dell PERC H330 RAID 컨트롤러, 블록 장치 없음(대부분)

CentOS 8, Dell PERC H330 RAID 컨트롤러, 블록 장치 없음(대부분)

우리는 최근에 새로운 Dell R340XL 서버를 구입하고 CentOS 8을 설치했습니다. BOSS 컨트롤러에서 부팅용 SSD 1개(sda)와 RAID 5의 PERC H330(sdb)에 4개의 HDDS가 있습니다. 며칠 동안은 잘 작동했지만 이틀 전에는 더 이상 RAID 볼륨을 볼 수 없었습니다. Dell에 전화를 걸어 여러 장치의 펌웨어를 업그레이드하는 데 도움을 주었지만 여전히 RAID 볼륨을 볼 수 없습니다. 어떤 도움이라도 주시면 감사하겠습니다.

lspci를 수행하면 장치가 나타납니다.

02:00.0 RAID bus controller: Broadcom / LSI MegaRAID SAS-3 3008 [Fury] (rev 02)
        Subsystem: Dell PERC H330 Adapter
...
        Kernel driver in use: megaraid_sas
        Kernel modules: megaraid_sas

MegaCli를 다운로드했는데, 온갖 정보를 얻을 수 있어요. 명령은 MegaCli64 -LdGetNum -aAll다음과 같이 알려줍니다.

Number of Virtual Drives Configured on Adapter 0: 1

서버를 계속해서 재부팅하면 가끔씩 RAID 어레이가 블록 장치로 나타나는 것을 볼 수 있지만 sda로 나타나 부팅 드라이브를 sdb로 만듭니다.

dmesg와 시스템 로그를 살펴보니 인식할 수 있는 방법이 많지 않지만 다음과 같은 내용이 표시됩니다.

[    1.296976] megasas: 07.707.51.00-rc1
[    1.301092] megaraid_sas 0000:02:00.0: FW now in Ready state
[    1.301095] megaraid_sas 0000:02:00.0: 63 bit DMA mask and 32 bit consistent mask
[    1.301363] megaraid_sas 0000:02:00.0: firmware supports msix        : (96)
[    1.301364] megaraid_sas 0000:02:00.0: current msix/online cpus      : (12/12)
[    1.301365] megaraid_sas 0000:02:00.0: RDPQ mode     : (disabled)
[    1.301366] megaraid_sas 0000:02:00.0: Current firmware supports maximum commands: 928        LDIO threshold: 237
[    1.301477] megaraid_sas 0000:02:00.0: Configured max firmware commands: 927
[    1.303185] megaraid_sas 0000:02:00.0: FW supports sync cache        : No

...

[    1.680004] megaraid_sas 0000:02:00.0: FW provided supportMaxExtLDs: 0       max_lds: 32
[    1.680005] megaraid_sas 0000:02:00.0: controller type       : iMR(0MB)
[    1.680005] megaraid_sas 0000:02:00.0: Online Controller Reset(OCR)  : Enabled
[    1.680006] megaraid_sas 0000:02:00.0: Secure JBOD support   : No
[    1.680006] megaraid_sas 0000:02:00.0: NVMe passthru support : No
[    1.680007] megaraid_sas 0000:02:00.0: FW provided TM TaskAbort/Reset timeout        : 0 secs/0 secs
[    1.702120] megaraid_sas 0000:02:00.0: INIT adapter done
[    1.702121] megaraid_sas 0000:02:00.0: Jbod map is not supported megasas_setup_jbod_map 5371
[    1.728949] megaraid_sas 0000:02:00.0: pci id                : (0x1000)/(0x005f)/(0x1028)/(0x1f44)
[    1.728950] megaraid_sas 0000:02:00.0: unevenspan support    : yes
[    1.728950] megaraid_sas 0000:02:00.0: firmware crash dump   : no
[    1.728951] megaraid_sas 0000:02:00.0: jbod sync map         : no
[    1.729017] scsi host0: Avago SAS based MegaRAID driver
[    1.730804] scsi 11:0:0:0: Processor         Marvell  Console          1.01 PQ: 0 ANSI: 5
[    1.732057] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732076] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732094] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732112] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732131] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732149] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732167] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732185] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732206] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732224] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732242] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured

할당 실패가 걱정스러워 보이지만 인터넷 검색을 시도했을 때 많은 것을 찾지 못했습니다. 한 사람이 200개가 넘는 논리 장치를 수행하려고 했지만 여기서는 확실히 그렇게 하지 않습니다.

미리 감사드립니다.

답변1

HBA330이 아닌 H330인지 다시 확인하세요. 정말 H330이라면 누군가 실수로 HBA/패스스루 모드로 설정하지 않았는지 확인하세요. 그런 단순한 것이길 바라지만, 그 이상의 것이 있을 것이라고 생각합니다.

답변2

관련 정보