FreeNAS está recebendo erros de paridade/CRC incorrigíveis

FreeNAS está recebendo erros de paridade/CRC incorrigíveis

Na minha instalação do FreeNAS 9.3, estou recebendo cada vez mais erros de paridade/CRC incorrigíveis (como estes aqui:

May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 b8 0e 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 68 10 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 18 12 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error

no começo eu mudei dois discos com essas menções - mas agora um dos meus discos mais novos (em outra porta) também está recebendo isso. Portanto, tenho certeza de que esta unidade não tem nenhum problema.

O que pode causar esses erros? Não temos Ram ECC neste servidor ...

No SMART Log não há nada apontando para problemas, então estou confuso:

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0


SMART Error Log Version: 1                                
No Errors Logged

SMART Self-test log structure revision number 1           
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      2398         -

Responder1

Você tem uma falha no disco, controlador ou cabo.

Você não forneceu detalhes sobre o hardware envolvido nesta solução. Não é um problema de RAM, mas trate-o como qualquer outra tentativa de solução de problemas:

  • Isso está afetando vários discos.
  • Os relatórios SMART nos discos não mostram erros... Mas elessãoSata...
  • Investigue como os discos estão conectados? Através do backplane? Através de cabos fan-out combinados?
  • Isso soa como equipamento SATA. Você trocou os cabos?
  • Qual é o relatório do seu controlador?
  • Você fezgoogle a string de errovocê tem recebido?

informação relacionada