Status do PERC S100 incorreto

Status do PERC S100 incorreto

PE T310 com PERC S100, um array RAID 5 com três unidades, o status do disco virtual falha, mas ele inicializa e tudo parece funcionar.

Todas as unidades no Server Administrator estão Online com uma marca verde, mas uma delas não tem tarefas disponíveis.

Também vi um desentendimento entre o OMSA e o BIOS. Se eu inicializar no BIOS, uma unidade estará pronta para o status, uma estará on-line e a outra estará sobressalente.

Atualizei os drivers BMC, BIOS e PERC S100 para os mais recentes e isso continua.

Isso é um problema comum? Há algo que eu possa fazer para remediar isso? Se uma unidade realmente falhou, eu não saberia, pois estou efetivamente voando às cegas.

Responder1

Parece que é provavelmente uma falha simples na unidade, combinada com alguns problemas do OMSA/controlador na exibição do status adequado.

A unidade com problema é provavelmente aquela que você está vendo no estado "pronto" do BIOS - isso significa apenas que a unidade ainda funciona quando o controlador tenta inicializá-la, mas não é mais um membro ativo do conjunto RAID devido para qualquer problema que inicialmente teve.

No entanto...

...uma unidade está com status pronto, uma com status on-line e uma com status sobressalente

Quantos discos rígidos existem neste controlador? Se houver apenas os 3 que você está listando, e o menu do BIOS do controlador relatar apenas 1 de 3 unidades como um membro íntegro do RAID5 (o que é claramente incorreto, pois você tem acesso a dados), então não podemos confiar nas informações que o controlador e a OMSA nos fornecem em relação à integridade/status do HDD.

Atualizei os drivers BMC, BIOS e PERC S100

Você também atualizou o firmware do PERC S100? Eu diria que isso é igualmente importante e provavelmente o culpado pelos relatórios incorretos observados.

o status do disco virtual falhou

Isso é do OMSA ou do BIOS do controlador? Seria bom saber o status do VD de ambos os lados.

Atualize o FW do controlador, caso ainda não tenha feito isso. Caso contrário, pode não haver muito mais que você possa fazer além de excluir e recriar o RAID. Entrar em contato com o suporte da Dell seria aconselhável nesse momento.

Responder2

É importante notar que substituí uma unidade neste array há algumas semanas (o array foi listado como degradado e não falhou), verifiquei que ele iniciou a reconstrução e nunca mais verifiquei. Agora vejo nos logs que a reconstrução falhou devido a erros de dados nos discos originais. Espero que se conseguisse concluir a reconstrução, estaria em boa forma.

O S100 não parece ter firmware – é um controlador apenas de software? Pelo menos não consigo encontrar nenhum download de firmware para ele. No entanto, estou usando a versão mais recente do driver.

Em outros controladores PERC de última geração, consegui iniciar uma verificação de consistência da matriz. Adoraria poder fazer isso aqui e depois reconstruí-lo, mas não vejo essa opção no OMSA neste controlador.

Minha única opção é se eu não conseguir concluir a reconstrução para recriar o conjunto RAID e restaurar a partir do backup para obter consistência no OMSA e no BIOS do controlador, sem mencionar os próprios discos?

informação relacionada