Wir haben vor Kurzem einen neuen Dell R340XL-Server gekauft und CentOS 8 installiert. Wir haben eine SSD zum Booten auf dem BOSS-Controller (als sda) und 4 HDDS auf dem PERC H330 in RAID 5 (als sdb). Es hat ein paar Tage lang gut funktioniert, aber vor zwei Tagen konnten wir das RAID-Volume nicht mehr sehen. Wir haben mit Dell telefoniert und sie haben uns geholfen, die Firmware auf mehreren Geräten zu aktualisieren, aber wir können das RAID-Volume immer noch nicht sehen. Für jede Hilfe wären wir sehr dankbar.
Das Gerät wird angezeigt, wenn ich lspci ausführe:
02:00.0 RAID bus controller: Broadcom / LSI MegaRAID SAS-3 3008 [Fury] (rev 02)
Subsystem: Dell PERC H330 Adapter
...
Kernel driver in use: megaraid_sas
Kernel modules: megaraid_sas
Ich habe MegaCli heruntergeladen und kann alle möglichen Informationen abrufen. Der Befehl MegaCli64 -LdGetNum -aAll
sagt mir Folgendes:
Number of Virtual Drives Configured on Adapter 0: 1
Wenn wir den Server immer wieder neu starten, sehen wir ab und zu, dass das RAID-Array als Blockgerät angezeigt wird, aber es wird als sda angezeigt, wodurch das Startlaufwerk zu sdb wird.
Ich habe mir Dmesg und die Systemprotokolle angesehen und weiß nicht viel, woran ich es erkennen soll, aber ich sehe Dinge wie diese:
[ 1.296976] megasas: 07.707.51.00-rc1
[ 1.301092] megaraid_sas 0000:02:00.0: FW now in Ready state
[ 1.301095] megaraid_sas 0000:02:00.0: 63 bit DMA mask and 32 bit consistent mask
[ 1.301363] megaraid_sas 0000:02:00.0: firmware supports msix : (96)
[ 1.301364] megaraid_sas 0000:02:00.0: current msix/online cpus : (12/12)
[ 1.301365] megaraid_sas 0000:02:00.0: RDPQ mode : (disabled)
[ 1.301366] megaraid_sas 0000:02:00.0: Current firmware supports maximum commands: 928 LDIO threshold: 237
[ 1.301477] megaraid_sas 0000:02:00.0: Configured max firmware commands: 927
[ 1.303185] megaraid_sas 0000:02:00.0: FW supports sync cache : No
...
[ 1.680004] megaraid_sas 0000:02:00.0: FW provided supportMaxExtLDs: 0 max_lds: 32
[ 1.680005] megaraid_sas 0000:02:00.0: controller type : iMR(0MB)
[ 1.680005] megaraid_sas 0000:02:00.0: Online Controller Reset(OCR) : Enabled
[ 1.680006] megaraid_sas 0000:02:00.0: Secure JBOD support : No
[ 1.680006] megaraid_sas 0000:02:00.0: NVMe passthru support : No
[ 1.680007] megaraid_sas 0000:02:00.0: FW provided TM TaskAbort/Reset timeout : 0 secs/0 secs
[ 1.702120] megaraid_sas 0000:02:00.0: INIT adapter done
[ 1.702121] megaraid_sas 0000:02:00.0: Jbod map is not supported megasas_setup_jbod_map 5371
[ 1.728949] megaraid_sas 0000:02:00.0: pci id : (0x1000)/(0x005f)/(0x1028)/(0x1f44)
[ 1.728950] megaraid_sas 0000:02:00.0: unevenspan support : yes
[ 1.728950] megaraid_sas 0000:02:00.0: firmware crash dump : no
[ 1.728951] megaraid_sas 0000:02:00.0: jbod sync map : no
[ 1.729017] scsi host0: Avago SAS based MegaRAID driver
[ 1.730804] scsi 11:0:0:0: Processor Marvell Console 1.01 PQ: 0 ANSI: 5
[ 1.732057] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732076] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732094] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732112] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732131] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732149] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732167] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732185] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732206] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732224] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
[ 1.732242] scsi_alloc_sdev: Allocation failure during SCSI scanning, some SCSI devices might not be configured
Dieser Zuordnungsfehler sieht besorgniserregend aus, aber als ich danach gegoogelt habe, habe ich nicht viel gefunden. Jemand hat versucht, über 200 logische Geräte zu verwenden, aber das machen wir hier definitiv nicht.
Dank im Voraus.
Antwort1
Überprüfen Sie noch einmal, ob es sich um einen H330 und nicht um einen HBA330 handelt. Und wenn es wirklich ein H330 ist, überprüfen Sie, ob es nicht versehentlich jemand in den HBA-/Passthrough-Modus versetzt hat. Ich hoffe, es ist etwas so Einfaches, aber ich vermute, da steckt noch mehr dahinter.
Antwort2
Ich würde versuchen, PERCCLI anstelle von MEGACLI zu verwendenhttps://www.dell.com/support/article/us/en/04/sln283135/how-to-use-the-poweredge-raid-controller-perc-command-line-interface-cli-utility-to-manage-your-raid-controller?lang=en