
디스크가 배수구로 내려가는 징후를 보이는 4개의 디스크 5TB raid5 설정이 있습니다. 미디어 오류를 보고하고 있으며 dmesg에서 여러 읽기 오류가 수정된 것을 볼 수 있습니다. smartctl은 "알림"을 보고하지만 지금까지는 당황하지 않습니다. 현재 새 디스크는 상당히 비싸기 때문에 Linux md 계층이 얼마나 강력한지 정확히 숙고하기 시작했습니다.
md가 실제로 디스크 오류를 처리하는 방법에 대해 누군가가 밝힐 수 있다면 감사하겠습니다. 예를 들어, md는 쓰기 및 읽기 오류를 어떻게 처리합니까? 디스크가 어레이에서 거부되려면 (실제로) 무엇이 필요합니까? 또한 최근에 md가 불량 블록 매핑을 지원한다는 내용도 읽었습니다. 이는 내가 커널 >3.1을 실행하는 경우 또는 md가 여전히 "작업"을 시도하여 사용 가능하게 만들려고 시도하는 경우 내가 겪었던 읽기 오류가 매핑되었음을 의미합니까?
답변1
데이터가 중요하다면 지금 디스크를 교체하세요. 모든 하위 시스템은 데이터 손실을 방지하기 위해 할 수 있는 모든 작업을 수행하지만 할 수 있는 작업에는 한계가 있습니다. 불량 블록 주위에 매핑할 수도 있습니다. 하나가 있으면 다른 블록도 있을 것입니다.
임박한 문제에 대한 대규모 경고를 받았습니다. 이를 무시하는 것은 고객 데이터에 대한 무책임한 행동입니다.
댓글을 달기에는 너무 길기 때문에 편집하세요.
당신의 질문이 실제로 무엇인지 모르겠습니다. 경고가 심각한지 알고 싶으십니까? 그렇습니다. 그것에 대해 뭔가가 필요합니까? 예, 그리고 지금입니다.
일부 하위 시스템 보고서에 오류가 있으면 해당 내용이 있고 중요합니다. 시스템이 여전히 이를 수정할 수 있더라도 지금으로부터 2분 후에는 더 이상 그렇지 않으며 디스크가 실패로 표시되고 오프라인 상태가 될 가능성이 높습니다.
Linux md raid는 적어도 하드웨어 RAID 구현만큼 신뢰할 수 있지만 최선의 상황에서는 RAID5를 위험한 선택이라고 생각합니다. 문제는 복원 중에 보호되지 않는다는 것입니다. 이는 RAID5의 경우 매우 부담스러운 상황입니다. 디스크에 오류가 발생하려고 할 때 고급 경고가 표시되는 반면 하드웨어 RAID는 사실이 발생한 후에만 알릴 수 있으므로 일부 하드웨어 RAID 시스템보다 더 신뢰할 수 있다고 생각합니다. 소프트웨어 RAID에는 주로 성능 문제와 관련된 몇 가지 단점이 있지만 안정성은 그중 하나가 아닙니다.
어쨌든, 이 점에 관계없이 귀하와 같은 상황에 대한 전문적인 접근 방식은 디스크를 즉시 교체하는 것입니다. 그러면 개인 디스크 어레이에 대한 저의 반응도 그럴 것입니다(이런 상황에 대비해 예비 디스크가 준비되어 있습니다).
답변2
이는 Dell 서버 중 하나를 사용한 약 6년 간의 경험에서 나온 것입니다. 당시에는 디스크 오류를 원격으로 감지할 가능성이 없었기 때문에 하드웨어 RAID를 사용하지 않았습니다.
그래서 우리는 소프트웨어 raid 1(md)을 사용했습니다. 잠시 후 습격이 저하되었습니다. /var/log/messages를 보면 특정 파티션과 관련된 IO 오류 목록이 있는 것을 확인했습니다.
RAID에 파티션을 다시 추가했는데 잠시 후 다시 삭제되었습니다.
/var/log/messages 출력을 Dell 지원팀에 보내고 즉시 새 디스크를 받았습니다. 이는 지원되지 않는 Linux 버전에서 발생했으며 가장 기본적인 지원 수준에서만 발생했습니다.
우리는 설정된 다른 머신이 두어 대 있었고 다시는 이러한 문제가 발생하지 않았습니다(즉, 디스크가 고장난 적이 없습니다). 나에게 이것은 당신이 md를 신뢰할 수 있다는 증거입니다.
나는 이것이 3.1 커널에서도 여전히 유효하다고 생각합니다(아직 이것들 중 하나도 가지고 있지 않습니다).
답변3
내가 아는 한 mdadm은 좋은 상태의 HD에서 어떤 유형의 오류도 거의 생성하지 않는 강력한 소프트웨어 RAID 구현입니다. mdadm이 구성된 서버가 여러 개 있고 로그 파일에서 읽기 오류가 발생하지 않았습니다.
다음을 사용하여 어레이 상태를 확인하십시오.
mdadm --detail /dev/mdX
그러나 오류가 발생한 드라이브를 교체하는 것이 좋습니다.