3Ware의 tw_cli에서 "DEGRADED" 디스크와 "ECC-ERROR"는 무엇을 의미합니까?

Question 1

ECC 오류는 드라이브에 읽을 수 없는 섹터가 하나 이상 있음을 의미합니다. 그러나 운이 좋다면 해당 섹터가 해당 볼륨에 있는 파일 시스템에서 실제로 사용되지 않을 수 있으므로 이 상태에서도 어레이에서 데이터를 복사할 수 있습니다.

재구축 중에 ECC 오류를 무시하는 몇 가지 옵션도 있습니다.

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

그러나 이러한 옵션을 사용하면 불량 섹터의 영향을 받은 RAID 스트라이프가 손상된다는 의미입니다(이 경우 카드가 정확히 무엇을 할지는 확실하지 않습니다. 전체 스트라이프를 0으로 대체하거나 심지어 임의의 데이터로 대체할 수도 있음). 복구됨” 어레이에는 실제로 감지할 수 없는 손상이 있을 수 있습니다(영향을 받은 스트라이프가 일부 데이터 파일의 중간에 있는 경우). 재구축을 시도하기 전에 어레이에서 다른 위치로 데이터를 복사하는 것이 더 안전할 수 있습니다(적어도 불량 영역을 읽으려고 하면 오류가 발생해야 합니다).

읽을 수 없는 섹터를 더 일찍 발견하도록 어레이의 예약된 확인을 설정해야 방금 손상되기 시작한 드라이브를 교체할 수 있습니다.

Answer

ECC 오류는 드라이브에 읽을 수 없는 섹터가 하나 이상 있음을 의미합니다. 그러나 운이 좋다면 해당 섹터가 해당 볼륨에 있는 파일 시스템에서 실제로 사용되지 않을 수 있으므로 이 상태에서도 어레이에서 데이터를 복사할 수 있습니다.

재구축 중에 ECC 오류를 무시하는 몇 가지 옵션도 있습니다.

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

그러나 이러한 옵션을 사용하면 불량 섹터의 영향을 받은 RAID 스트라이프가 손상된다는 의미입니다(이 경우 카드가 정확히 무엇을 할지는 확실하지 않습니다. 전체 스트라이프를 0으로 대체하거나 심지어 임의의 데이터로 대체할 수도 있음). 복구됨” 어레이에는 실제로 감지할 수 없는 손상이 있을 수 있습니다(영향을 받은 스트라이프가 일부 데이터 파일의 중간에 있는 경우). 재구축을 시도하기 전에 어레이에서 다른 위치로 데이터를 복사하는 것이 더 안전할 수 있습니다(적어도 불량 영역을 읽으려고 하면 오류가 발생해야 합니다).

읽을 수 없는 섹터를 더 일찍 발견하도록 어레이의 예약된 확인을 설정해야 방금 손상되기 시작한 드라이브를 교체할 수 있습니다.

Question 2

물리적 드라이브(p0)가 DEGRADED 상태로 전환되는 것을 경험한 적이 없지만 다음을 통해 ECC-ERROR 드라이브 또는 DEGRADED 드라이브를 제거하여 다시 복구할 수 있습니다.

/c0 p1 remove

그런 다음 다시 스캔을 실행합니다.

/c0 rescan

다음을 통해 공격대 유닛에 다시 넣습니다.

maint rebuild c0 u0 p1

ECC-ERROR로 인해 실패한 SATA 드라이브는 다시 실패하기 전에 몇 시간만이라도 부활할 수 있었습니다.

Answer