O que o tw_cli da 3Ware significa com disco "DEGRADADO" versus "ECC-ERROR"?

Question 1

Erro ECC significa que há pelo menos um setor ilegível na unidade. No entanto, se você tiver sorte, esse setor poderá não ser realmente usado pelo sistema de arquivos localizado nesse volume; portanto, você ainda poderá copiar seus dados da matriz nesse estado.

Existem também algumas opções para ignorar erros de ECC durante a reconstrução:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

No entanto, usar essas opções significa que a faixa RAID afetada por um setor defeituoso será corrompida (não tenho certeza do que exatamente a placa fará neste caso - ela pode substituir toda a faixa por zeros, ou mesmo por dados aleatórios), portanto o “ recuperado” pode, na verdade, ter corrupção indetectável (se a faixa afetada estiver no meio de algum arquivo de dados). Copiar seus dados do array para algum outro lugar antes de tentar reconstruir pode ser mais seguro (pelo menos você deve obter erros ao tentar ler a área danificada).

Você deve configurar a verificação agendada da matriz para detectar setores ilegíveis mais cedo, para que possa substituir uma unidade que começou a apresentar problemas.

Answer

Erro ECC significa que há pelo menos um setor ilegível na unidade. No entanto, se você tiver sorte, esse setor poderá não ser realmente usado pelo sistema de arquivos localizado nesse volume; portanto, você ainda poderá copiar seus dados da matriz nesse estado.

Existem também algumas opções para ignorar erros de ECC durante a reconstrução:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

No entanto, usar essas opções significa que a faixa RAID afetada por um setor defeituoso será corrompida (não tenho certeza do que exatamente a placa fará neste caso - ela pode substituir toda a faixa por zeros, ou mesmo por dados aleatórios), portanto o “ recuperado” pode, na verdade, ter corrupção indetectável (se a faixa afetada estiver no meio de algum arquivo de dados). Copiar seus dados do array para algum outro lugar antes de tentar reconstruir pode ser mais seguro (pelo menos você deve obter erros ao tentar ler a área danificada).

Você deve configurar a verificação agendada da matriz para detectar setores ilegíveis mais cedo, para que possa substituir uma unidade que começou a apresentar problemas.

Question 2

Nunca experimentei uma unidade física (p0) entrar no status DEGRADADO, no entanto, você pode conseguir recuperar a unidade ECC-ERROR ou mesmo a unidade DEGRADADA removendo-os via

/c0 p1 remove

e, em seguida, emitindo uma nova varredura

/c0 rescan

coloque-os de volta na unidade de ataque via

maint rebuild c0 u0 p1

Unidades SATA que falharam com ECC-ERROR, consegui ressuscitar, mesmo que apenas por algumas horas, antes de falhar novamente.

Answer

Nunca experimentei uma unidade física (p0) entrar no status DEGRADADO, no entanto, você pode conseguir recuperar a unidade ECC-ERROR ou mesmo a unidade DEGRADADA removendo-os via

/c0 p1 remove

e, em seguida, emitindo uma nova varredura

/c0 rescan

coloque-os de volta na unidade de ataque via

maint rebuild c0 u0 p1

Unidades SATA que falharam com ECC-ERROR, consegui ressuscitar, mesmo que apenas por algumas horas, antes de falhar novamente.

Question 3

É muito provável que seus dados tenham desaparecido. Erro ECC significa um erro irrecuperável durante a leitura deste disco.

Se você não tiver um backup, poderá tentar despejar o estado atual do array. Isso pode ser possível porque o controlador não sabe se perdeu dados ou apenas uma área vazia (falta qualquer visão do sistema de arquivos).

Answer

É muito provável que seus dados tenham desaparecido. Erro ECC significa um erro irrecuperável durante a leitura deste disco.

Se você não tiver um backup, poderá tentar despejar o estado atual do array. Isso pode ser possível porque o controlador não sabe se perdeu dados ou apenas uma área vazia (falta qualquer visão do sistema de arquivos).

O que o tw_cli da 3Ware significa com disco "DEGRADADO" versus "ECC-ERROR"?

Responder1

Responder2

Responder3

informação relacionada