DL380 G5, RAID5, ext3, RAID 실패

DL380 G5, RAID5, ext3, RAID 실패

우리는 1.2TB의 민감한 임상 환자 데이터를 호스팅하는 ext3 파일 시스템의 논리 볼륨으로 포맷된 외부 베이에 RAID5 어레이에 5개의 300GB SCSI 3.5'' 디스크가 있는 오래된 HP DL380G5 서버를 보유하고 있습니다.

두 개의 디스크가 hpacucli에서 예측 실패를 보여서 그 중 하나를 먼저 교체하고 괜찮다고 보았지만 "Ready for 재건"이라는 메시지도 표시되는 것은 보지 못했습니다. 두 번째 것도 완전히 부주의하게 변경했는데 이제 RAID에 실패했다고 표시됩니다.

이전 디스크를 다시 반환하고 서버 재부팅을 시도했지만 이제 부팅 중에 복구 모드로 전환되고 논리 볼륨을 찾을 수 없다는 메시지가 표시됩니다.

이것을 복원하기 위해 제가 할 수 있는 일이 있나요? 안타깝게도 백업이 없습니다. 어떤 도움이라도 정말 감사하겠습니다!

두 개의 기존 드라이브를 모두 다시 반환하려고 생각 중인데 이것이 RAID를 부활시킬 가능성이 있습니까?

답변1

죄송합니다. 하지만 이는 운영자의 실수입니다.

RAID5 어레이에 두 개의 오류가 있는 디스크가 있었고 어레이가 유지할 수 있는 것보다 더 많은 디스크를 제거했습니다.

백업도 없이 이렇게 하는 것은 더 큰 실수입니다.

손상된 논리 드라이브에서 데이터를 복구하려면 데이터 복구 회사에 문의해야 합니다.

답변2

시스템 전원을 다시 켜지 마십시오. 종료하고 데이터 복구 서비스에 전화하십시오. 이러한 유형의 오류를 원격으로 복구할 수 있는 다양한 서비스가 있습니다. 이 시점에서 당신이 할 수 있는 일은 상황을 악화시키는 것 뿐이다.

여기에는 모든 드라이브를 정상 작동이 확인된 HBA(RAID 카드나 기타 컨트롤러 아님!)에 직접 연결하고 원격 관리 도구를 사용하여 다운로드 가능한 특정 Linux 이미지를 시작하는 작업이 포함되는 경우가 많습니다. 그런 다음 회사는 시스템에 원격으로 액세스하여 디스크 상태를 평가하고 남은 RAID 메타데이터를 복구합니다. 독점 소프트웨어를 사용하여 가상 RAID 디스크(기술적 세부 사항: 표준 Linux 장치 매퍼 시스템에 연결되는 경우가 많음)를 다시 조립할 수 있습니다. 그런 다음 RAID 읽기 전용 소프트웨어 내(RAID SoC 가속기 없음)가 노출됩니다. 다음 단계는 데이터가 사용할 수 없을 정도로 손상되지 않았는지 확인하고 가상 디스크를 새 디스크에 복제하여 데이터 복구를 완료하는 것입니다. 그 후에는 시스템을 백업하고 실행하는 것에 대해 걱정할 수 있습니다.

여기서는 서비스 이름을 언급하지 않겠지만 대부분은 쉽게 찾을 수 있으며 원격 서비스를 제공하는 서비스의 경우(RAID 드라이브 + 복구 드라이브를 해당 서비스에 배송하고 복구 + 복제 및 복제를 기다리는 왕복 시간을 절약할 수 있음) 다시 전송) 데이터가 실제로 시설을 떠나지 않는다는 이점을 얻을 수 있습니다.


약간의 좋은 소식: RAID 컨트롤러(또는 사용자)가 디스크에 새 데이터를 쓰지 않고 사전 오류 경고가 오류 경고가 아닌 한 실제로 99.9999%의 확률이 있습니다. 훌륭한 데이터 복구 팀은 모든 것을 합리적으로 빠르게 복원할 수 있습니다.

답변3

Re: 기존 드라이브를 복원합니다.

RAID가 완전히 작동하지 않기 때문에 두 개의 사전 장애 드라이브를 다시 장착해도 손실이 거의 없습니다.

원래 베이에 설치하십시오.

완전히 실패한 것이 아니라 사전 실패이므로 데이터를 복구할 수 있을 만큼 오랫동안 실행될 가능성이 높다는 점을 기억하세요.

레이드가 단순히 나타나지 않을 가능성이 있고, 컨트롤러가 레이드를 "재설정"(아니오/취소 선택)하도록 요청할 가능성이 적고, 레이드 컨트롤러가 자동으로 레이드를 재설정하여 값을 무효화할 가능성이 아주 적습니다. 데이터 복구 회사에서 추가했습니다.

따라서 RAID가 나타나면 최우선 순위는 데이터를 끄는 것입니다. 이는 최소 1.2TB의 사용 가능한 공간이 있고 데이터를 복사할 준비가 되어 있으며 Linux 케이스와 robocopy같은 도구를 실행할 준비가 되어 있어야 함을 의미합니다. 드라이브가 마지막 순간을 낭비한다면 매뉴얼 페이지를 읽고 구문을 파악하는 데 시간을 낭비하고 싶지 않을 것입니다.xcopy32rsync


데이터가 안전해지면 새 드라이브를 사용하여 RAID를 raid6으로 다시 만드십시오. 300GB의 용량이 줄어들지만 드라이브 2개를 허용할 수 있습니다. 또는 추가 드라이브를 추가하고 6개 드라이브 이상의 raid10을 고려하십시오. 아니면 이 시스템을 완전히 폐기하는 것을 고려해보세요. G5는 10년이 넘었고 더 이상 중요한 생산 작업에 적합하지 않습니다.

부팅을 시도하지 말고 적절한 백업 솔루션도 설정하십시오. 다음 번에 있을 것입니다.

관련 정보