CentOS 8, controlador RAID Dell PERC H330, sem dispositivo de bloco (na maioria das vezes)

CentOS 8, controlador RAID Dell PERC H330, sem dispositivo de bloco (na maioria das vezes)

Recentemente compramos um novo servidor Dell R340XL e instalamos o CentOS 8. Temos um SSD para inicialização no controlador BOSS (como sda) e 4 HDDS no PERC H330 em RAID 5 (como sdb). Funcionou bem por alguns dias, quando há dois dias não conseguíamos mais ver o volume RAID. Conversamos por telefone com a Dell e eles nos ajudaram a atualizar firmwares em vários dispositivos, mas ainda não conseguimos ver o volume RAID. Qualquer ajuda seria muito apreciada.

O dispositivo aparece quando eu faço lspci:

02:00.0 RAID bus controller: Broadcom / LSI MegaRAID SAS-3 3008 [Fury] (rev 02)
        Subsystem: Dell PERC H330 Adapter
...
        Kernel driver in use: megaraid_sas
        Kernel modules: megaraid_sas

Baixei o MegaCli e posso obter todo tipo de informação. O comando MegaCli64 -LdGetNum -aAllme diz isso:

Number of Virtual Drives Configured on Adapter 0: 1

Se reinicializarmos o servidor repetidamente, de vez em quando, veremos a matriz RAID aparecer como um dispositivo de bloco, mas aparecerá como sda, tornando a unidade de inicialização sdb.

Examinei o dmesg e os logs do sistema e não há muito que saiba reconhecer, mas vejo coisas como isto:

[    1.296976] megasas: 07.707.51.00-rc1
[    1.301092] megaraid_sas 0000:02:00.0: FW now in Ready state
[    1.301095] megaraid_sas 0000:02:00.0: 63 bit DMA mask and 32 bit consistent mask
[    1.301363] megaraid_sas 0000:02:00.0: firmware supports msix        : (96)
[    1.301364] megaraid_sas 0000:02:00.0: current msix/online cpus      : (12/12)
[    1.301365] megaraid_sas 0000:02:00.0: RDPQ mode     : (disabled)
[    1.301366] megaraid_sas 0000:02:00.0: Current firmware supports maximum commands: 928        LDIO threshold: 237
[    1.301477] megaraid_sas 0000:02:00.0: Configured max firmware commands: 927
[    1.303185] megaraid_sas 0000:02:00.0: FW supports sync cache        : No

...

[    1.680004] megaraid_sas 0000:02:00.0: FW provided supportMaxExtLDs: 0       max_lds: 32
[    1.680005] megaraid_sas 0000:02:00.0: controller type       : iMR(0MB)
[    1.680005] megaraid_sas 0000:02:00.0: Online Controller Reset(OCR)  : Enabled
[    1.680006] megaraid_sas 0000:02:00.0: Secure JBOD support   : No
[    1.680006] megaraid_sas 0000:02:00.0: NVMe passthru support : No
[    1.680007] megaraid_sas 0000:02:00.0: FW provided TM TaskAbort/Reset timeout        : 0 secs/0 secs
[    1.702120] megaraid_sas 0000:02:00.0: INIT adapter done
[    1.702121] megaraid_sas 0000:02:00.0: Jbod map is not supported megasas_setup_jbod_map 5371
[    1.728949] megaraid_sas 0000:02:00.0: pci id                : (0x1000)/(0x005f)/(0x1028)/(0x1f44)
[    1.728950] megaraid_sas 0000:02:00.0: unevenspan support    : yes
[    1.728950] megaraid_sas 0000:02:00.0: firmware crash dump   : no
[    1.728951] megaraid_sas 0000:02:00.0: jbod sync map         : no
[    1.729017] scsi host0: Avago SAS based MegaRAID driver
[    1.730804] scsi 11:0:0:0: Processor         Marvell  Console          1.01 PQ: 0 ANSI: 5
[    1.732057] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732076] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732094] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732112] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732131] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732149] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732167] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732185] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732206] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732224] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[    1.732242] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured

Essa falha na alocação parece preocupante, mas quando tentei pesquisar no Google, não encontrei muita coisa. Uma pessoa estava tentando fazer mais de 200 dispositivos lógicos, mas definitivamente não estamos fazendo isso aqui.

Desde já, obrigado.

Responder1

Verifique novamente se é um H330, não um HBA330; e se for realmente um H330, verifique se alguém não o colocou acidentalmente no modo HBA/passagem. Espero que seja algo simples assim, mas acho que há mais do que isso.

Responder2

informação relacionada