Problema de falha prevista do Proliant ML310e Gen8 Smart Array com SSD

Problema de falha prevista do Proliant ML310e Gen8 Smart Array com SSD

Esta é uma questão relacionada a esta:

Soluções SSD de terceiros em servidores ProLiant Gen8

mas não coberto pela pergunta ou pelas respostas.

Eu tenho um SSD OCZ de 120 GB como unidade de sistema em um servidor Proliant ML310e Gen8, localizado na porta SATA 6. Para usar essa porta (na placa-mãe) para o SSD, devo configurar o controlador SATA como controlador SMART Array. Isso me dá todos os 4 compartimentos para um conjunto RAID de unidades HDD.

Até agora tudo bem. Também instalei o Win Server 2008 R2 na unidade do sistema e tudo funciona bem.

MAS - quando eu chacoco o SMART Array, ele diz "falha prevista da unidade 0 (SSD)". Eu verifiquei e verifiquei as configurações SMART reais do SSD e a unidade está 100% OK. É totalmente novo e as configurações SMART foram verificadas como 100% OK pelo suporte da OCZ.

Não consigo eliminar esse erro no lado do diagnóstico da HP e, por sugestão da OCZ, tenho tentado descobrir como desativar o diagnóstico SMART na HP, sem sucesso.

ASSIM - como posso limpar a leitura de diagnóstico do HP SMART Array (incorreta) dos dados SMART do SSD OCZ ou como posso desligar a HP que lê as estatísticas SMART do SSD.

Sei que a culpa é inteiramente minha por não querer gastar mais de US $ 1.000 em um SSD da marca HP, mas o OCZ está funcionando perfeitamente bem. É apenas a versão OCZ do SMART que não é a mesma ideia da HP de SMART para estatísticas de unidades SSD, e estou realmente cansado da luz amarela piscando "sistema degradado" no painel frontal.

E sim, já me disseram "coloque fita isolante preta por cima". :-)

Mas eu realmente gostaria de encontrar uma solução melhor. Esse material SMART deveria ser quase universal.

Responder1

Estou executando um ML310e Gen8 v2 com SSDs SATA na porta 5/6 b120i integrada (sem arrays/jbod - apenas usando o controlador para tornar a porta 6 inicializável) e encontrei uma solução para impedir que as unidades SSD sejam exibidas como falhadas na reinicialização ! Este é o homelab rodando linux/zfs, mas eu certamente usaria em produção.

  1. Abra o Smart Storage Administrator (SSA) - fiz isso no POST usando F5 assim que o controlador foi detectado. Você também pode fazer isso através do Intelligent Provisioning (F10).

  2. Vá para Modificar configurações do controlador e desative "Prioridade de análise de varredura de superfície". Isso impedirá que o controlador tente fazer uma varredura superficial em seus SSDs, o que impede que eles sejam marcados como com falha.

  3. Aproveite SSDs SATA de terceiros sem que eles sejam desativados por falha na inicialização.

O Guia do usuário do administrador do HP Smart Storage deu uma dica sobre a solução. Parece que o modo surfacescan faz com que os SSDs sejam marcados como falhados. Este manual mostra outras maneiras de acessar o SSA - e acredito que o Surfacescanmode pode ser desativado por slot usando a ferramenta ssacli (talvez via serial/iLo também?) Se você realmente quiser usar isso em outras unidades (no entanto, não tentei isso já que não uso nenhuma funcionalidade do controlador de array... em vez disso, use monitoramento inteligente)

De acordo com o guia do usuário do SSA, essa configuração também deve funcionar com o Gen9. Também com Gen6, Gen7 (acesse SSA por meio de download de imagem) - suspeito que Gen5 também funcionaria, pois suporta ssacli.

Responder2

Mas o SSD OCZnão éfuncionando bem... Provavelmente não está reportando sua temperatura corretamente ao controlador.

SeuHP ProLiant ML310eO servidor Gen8 possui um servidor "Dinâmico" incorporadoControlador Smart Array B120ina placa-mãe. Este é um dispositivo "softraid". Este é o único disco no servidor? Não está claro na sua pergunta. Se não, onde estão osoutrodiscos conectados?

Existem tantas limitações nesta configuração que não sei o que dizer.

  • Este é um controlador RAID assistido por software.
  • Apenas 2 de suas 6 portas são de 6 Gbps. É por isso que estou perguntando o que mais está dentro do servidor.
  • Ele suporta apenas dispositivos SATA.
  • Muitas situações exigem a desativação da funcionalidade RAID.
  • Sem cache.

Seu problema específico pode ser apenas a unidade OCZ (eles estão falidos de qualquer maneira). Tente com outro SSD, se puder.

Editar:

Eu pularia o uso de um SSD não RAID neste servidor e confiaria apenas nos seus (4?) compartimentos de disco internos.

No mundo HP ProLiant, você pode criar váriosunidades lógicasem uma matriz física. Então, pegue seu grupo de discos, usando oUtilitário de configuração de matrizpara criar uma unidade lógica de 120 GB para o seu sistema operacional e alocar o restante do espaço para os dados. O Smart Array B120i suporta 8 unidades lógicas, então essa é a maneira mais fácil de lidar com isso... a menos que vocêprecisarum SSD. Mas não parece ser necessário para este servidor.

informação relacionada