Linux 소프트웨어 RAID 견고성

Question 1

데이터가 중요하다면 지금 디스크를 교체하세요. 모든 하위 시스템은 데이터 손실을 방지하기 위해 할 수 있는 모든 작업을 수행하지만 할 수 있는 작업에는 한계가 있습니다. 불량 블록 주위에 매핑할 수도 있습니다. 하나가 있으면 다른 블록도 있을 것입니다.

임박한 문제에 대한 대규모 경고를 받았습니다. 이를 무시하는 것은 고객 데이터에 대한 무책임한 행동입니다.

댓글을 달기에는 너무 길기 때문에 편집하세요.

당신의 질문이 실제로 무엇인지 모르겠습니다. 경고가 심각한지 알고 싶으십니까? 그렇습니다. 그것에 대해 뭔가가 필요합니까? 예, 그리고 지금입니다.

일부 하위 시스템 보고서에 오류가 있으면 해당 내용이 있고 중요합니다. 시스템이 여전히 이를 수정할 수 있더라도 지금으로부터 2분 후에는 더 이상 그렇지 않으며 디스크가 실패로 표시되고 오프라인 상태가 될 가능성이 높습니다.

Linux md raid는 적어도 하드웨어 RAID 구현만큼 신뢰할 수 있지만 최선의 상황에서는 RAID5를 위험한 선택이라고 생각합니다. 문제는 복원 중에 보호되지 않는다는 것입니다. 이는 RAID5의 경우 매우 부담스러운 상황입니다. 디스크에 오류가 발생하려고 할 때 고급 경고가 표시되는 반면 하드웨어 RAID는 사실이 발생한 후에만 알릴 수 있으므로 일부 하드웨어 RAID 시스템보다 더 신뢰할 수 있다고 생각합니다. 소프트웨어 RAID에는 주로 성능 문제와 관련된 몇 가지 단점이 있지만 안정성은 그중 하나가 아닙니다.

어쨌든, 이 점에 관계없이 귀하와 같은 상황에 대한 전문적인 접근 방식은 디스크를 즉시 교체하는 것입니다. 그러면 개인 디스크 어레이에 대한 저의 반응도 그럴 것입니다(이런 상황에 대비해 예비 디스크가 준비되어 있습니다).

Answer

데이터가 중요하다면 지금 디스크를 교체하세요. 모든 하위 시스템은 데이터 손실을 방지하기 위해 할 수 있는 모든 작업을 수행하지만 할 수 있는 작업에는 한계가 있습니다. 불량 블록 주위에 매핑할 수도 있습니다. 하나가 있으면 다른 블록도 있을 것입니다.

임박한 문제에 대한 대규모 경고를 받았습니다. 이를 무시하는 것은 고객 데이터에 대한 무책임한 행동입니다.

댓글을 달기에는 너무 길기 때문에 편집하세요.

당신의 질문이 실제로 무엇인지 모르겠습니다. 경고가 심각한지 알고 싶으십니까? 그렇습니다. 그것에 대해 뭔가가 필요합니까? 예, 그리고 지금입니다.

일부 하위 시스템 보고서에 오류가 있으면 해당 내용이 있고 중요합니다. 시스템이 여전히 이를 수정할 수 있더라도 지금으로부터 2분 후에는 더 이상 그렇지 않으며 디스크가 실패로 표시되고 오프라인 상태가 될 가능성이 높습니다.

Linux md raid는 적어도 하드웨어 RAID 구현만큼 신뢰할 수 있지만 최선의 상황에서는 RAID5를 위험한 선택이라고 생각합니다. 문제는 복원 중에 보호되지 않는다는 것입니다. 이는 RAID5의 경우 매우 부담스러운 상황입니다. 디스크에 오류가 발생하려고 할 때 고급 경고가 표시되는 반면 하드웨어 RAID는 사실이 발생한 후에만 알릴 수 있으므로 일부 하드웨어 RAID 시스템보다 더 신뢰할 수 있다고 생각합니다. 소프트웨어 RAID에는 주로 성능 문제와 관련된 몇 가지 단점이 있지만 안정성은 그중 하나가 아닙니다.

어쨌든, 이 점에 관계없이 귀하와 같은 상황에 대한 전문적인 접근 방식은 디스크를 즉시 교체하는 것입니다. 그러면 개인 디스크 어레이에 대한 저의 반응도 그럴 것입니다(이런 상황에 대비해 예비 디스크가 준비되어 있습니다).

Question 2

이는 Dell 서버 중 하나를 사용한 약 6년 간의 경험에서 나온 것입니다. 당시에는 디스크 오류를 원격으로 감지할 가능성이 없었기 때문에 하드웨어 RAID를 사용하지 않았습니다.

그래서 우리는 소프트웨어 raid 1(md)을 사용했습니다. 잠시 후 습격이 저하되었습니다. /var/log/messages를 보면 특정 파티션과 관련된 IO 오류 목록이 있는 것을 확인했습니다.

RAID에 파티션을 다시 추가했는데 잠시 후 다시 삭제되었습니다.

/var/log/messages 출력을 Dell 지원팀에 보내고 즉시 새 디스크를 받았습니다. 이는 지원되지 않는 Linux 버전에서 발생했으며 가장 기본적인 지원 수준에서만 발생했습니다.

우리는 설정된 다른 머신이 두어 대 있었고 다시는 이러한 문제가 발생하지 않았습니다(즉, 디스크가 고장난 적이 없습니다). 나에게 이것은 당신이 md를 신뢰할 수 있다는 증거입니다.

나는 이것이 3.1 커널에서도 여전히 유효하다고 생각합니다(아직 이것들 중 하나도 가지고 있지 않습니다).

Answer