storcli64 não importa um dg estrangeiro com discos anteriormente offline

storcli64 não importa um dg estrangeiro com discos anteriormente offline

Eu experimentei uma estranha cascata de "falhas" de disco em poucos minutos em um AVAGO MegaRAID SAS 9361-8i no Linux. Durante esse período, uma unidade sobressalente nunca foi ativada. Ignorando algumas unidades JBOD não relacionadas (que parecem boas), o DG definido foi RAID6. Quando o terceiro disco falhou, o DG foi colocado offline. Como os discos falharam tão rapidamente, suspeito que eles não sejam o verdadeiro problema. Pensei que talvez pudesse tentar recuperar o DG.

Reiniciei o dispositivo e agora os discos estão marcados como "estrangeiros":

Drive Information :
=================

-----------------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                   Sp Type 
-----------------------------------------------------------------------------------
23:0     24 GHS   -  3.637 TB SATA HDD N   N  512B WDC WD4000FYYZ-01UL1B1  D  -    
23:1     31 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:2     25 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:3     30 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:4     26 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:5     29 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L0  U  -    
23:6     27 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:7     33 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:8     28 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:9     32 UGood F  3.637 TB SATA HDD N   N  512B WDC WD4000F9YZ-09N20L1  U  -    
23:10    42 JBOD  -  3.638 TB SATA HDD N   N  512B WDC WD40EFRX-68N32N0    U  -    
23:11    41 JBOD  -  3.638 TB SATA HDD N   N  512B WDC WD40EFZX-68AWUN0    U  -    
23:18    39 JBOD  -  1.819 TB SATA HDD N   N  512B Hitachi HDS722020ALA330 U  -    
23:23    40 JBOD  -  3.638 TB SATA HDD N   N  512B WDC WD40EFZX-68AWUN0    U  -    
-----------------------------------------------------------------------------------

Observe que não sei por que eles estão marcados como "estrangeiros"; Não movi, adicionei ou removi nenhum disco.

Uma prévia:

# /opt/MegaRAID/storcli/storcli64 /c0/fall import preview
CLI Version = 007.1705.0000.0000 Mar 31, 2021
Operating system = Linux 3.10.0-1160.25.1.el7.x86_64
Controller = 0
Status = Success
Description = Operation on foreign configuration Succeeded


FOREIGN PREVIEW :
===============

----------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT      Size PDC  PI SED DS3  FSpace TR 
----------------------------------------------------------------------------
 0 -   -   -        -   RAID6 OfLn  N  25.466 TB dflt N  N   dflt Y      N  
 0 0   -   -        -   RAID6 Dgrd  N  25.466 TB dflt N  N   dflt Y      N  
 0 0   0   23:9     32  DRIVE Offln N   3.637 TB dflt N  N   dflt -      N  
 0 0   1   23:1     31  DRIVE Onln  N   3.637 TB dflt N  N   dflt -      N  
 0 0   2   23:2     25  DRIVE Onln  N   3.637 TB dflt N  N   dflt -      N  
 0 0   3   23:3     30  DRIVE Onln  N   3.637 TB dflt N  N   dflt -      N  
 0 0   4   23:4     26  DRIVE Onln  N   3.637 TB dflt N  N   dflt -      N  
 0 0   5   23:5     29  DRIVE Onln  N   3.637 TB dflt N  N   dflt -      N  
 0 0   6   23:6     27  DRIVE Offln N   3.637 TB dflt N  N   dflt -      N  
 0 0   7   23:7     33  DRIVE Onln  N   3.637 TB dflt N  N   dflt -      N  
 0 0   8   23:8     28  DRIVE Offln N   3.637 TB dflt N  N   dflt -      N  
----------------------------------------------------------------------------

DG=Disk Group Index|Arr=Array Index|Row=Row Index|EID=Enclosure Device ID
DID=Device ID|Type=Drive Type|Onln=Online|Rbld=Rebuild|Optl=Optimal|Dgrd=Degraded
Pdgd=Partially degraded|Offln=Offline|BT=Background Task Active
PDC=PD Cache|PI=Protection Info|SED=Self Encrypting Drive|Frgn=Foreign
DS3=Dimmer Switch 3|dflt=Default|Msng=Missing|FSpace=Free Space Present
TR=Transport Ready

Total foreign Drive Groups = 1

Quando tento importar, ocorre um erro:

# /opt/MegaRAID/storcli/storcli64 /c0/fall import 
CLI Version = 007.1705.0000.0000 Mar 31, 2021
Operating system = Linux 3.10.0-1160.25.1.el7.x86_64
Controller = 0
Status = Failure
Description = Incomplete foreign configuration

Pensei em tentar forçar on-line as unidades off-line visualizadas, mas:

# /opt/MegaRAID/storcli/storcli64 /c0/e23/s8 set online
CLI Version = 007.1705.0000.0000 Mar 31, 2021
Operating system = Linux 3.10.0-1160.25.1.el7.x86_64
Controller = 0
Status = Failure
Description = Set Drive Online Failed.

Detailed Status :
===============

------------------------------------------------
Drive      Status  ErrCd ErrMsg                 
------------------------------------------------
/c0/e23/s8 Failure   255 Operation not allowed. 
------------------------------------------------

Isso ocorre com todos os três.

Existe alguma maneira de recuperar isso? Além disso, alguém já ouviu falar desse tipo de cascata repentina de falhas de disco sem espaço quente girando?

informação relacionada