디스크 불량 섹터로 인한 데이터 손실을 방지하는 방법은 무엇입니까?

디스크 불량 섹터로 인한 데이터 손실을 방지하는 방법은 무엇입니까?

제목 그대로 우리가 어떻게 할 수 있을까 걱정스럽습니다.데이터 손실 방지하드디스크(기계식 HDD 또는 SSD) 불량 섹터로 인해 발생합니다.

\추가 정보\

질문이 잘 정의되어 있습니다. 질문은 여기서 끝납니다. 더 많은 정보를 제공하도록 노력하겠습니다. 저장 장치 오류(하드웨어 오류, 바이러스 우선 제외)는 크게 두 가지 유형으로 나뉩니다.

  1. 전체 디스크 결함. 디스크 내부에서 기계적 및/또는 전자적으로 문제가 발생하면 디스크에 액세스할 수 없게 됩니다.

  2. 불량 섹터. 특정 부분만 불량입니다. 전체 디스크가 제대로 작동하는 것 같습니다. 특정 불량 섹터에 액세스/확인하지 않으면 불량 섹터가 있는지 결코 알 수 없습니다.

\RAID는 불량 섹터로 인한 데이터 손실을 피할 수 없습니다.\

RAID1, RAID5 또는 RAID6은 사례 1로 인한 데이터 손실을 방지할 수 있습니다. 그러나 제가 아는 한 표준 RAID는 모든 데이터를 정기적으로 검색하고 확인하지 않으므로 RAID는 사례 2로 인한 데이터 손실을 피할 수 없습니다. 예를 들어, RAID1 미러의 경우. 첫 번째 디스크에 불량 섹터가 나타나면 첫 번째 디스크의 파일이 손상된 것입니다. 그 당시에는 두 번째 디스크에 미러링된 파일이 여전히 남아 있습니다.하지만 우리는 배드 섹터(Bad Sector)가 있는지 모릅니다.따라서 RAID1 어레이는 디스크 오류를 나타내지 않으며 복구를 트리거하지 않습니다. 그런 다음 시간이 지남에 따라 점점 더 많은 불량 섹터가 나타납니다. (모든 하드웨어가 마모되는 것은 시간 문제일 뿐입니다.) 두 번째 디스크의 정확한 미러링된 비트/미러링된 부분에도 불량 섹터가 발생할 가능성은 분명히 있습니다. 현재로서는 더 이상 중복된 복사본이 없습니다.영향을 받은 데이터는 영원히 손실됩니다.마찬가지로, 우리는 이것을 즉시 알아채지 못할 것입니다. 우리는 해당 데이터에 접근할 때까지만 이 손실을 알아낼 것입니다.

\ZFS인가?(체크섬이 있는 파일 시스템)해결책?\

불량 섹터로 인한 데이터 손실을 방지하고 싶은 걱정 때문에 파일 체크섬을 조사하기 시작했습니다. 널리 사용되는 파일 시스템에는 모든 파일의 체크섬이 포함되어 있지 않은 것 같습니다. 나는 Gentoo Linux에 대해 어느 정도 지식을 갖고 있습니다. 따라서 나는 Gentoo Linux에서 ZFS를 사용할 계획입니다.

"스토리지 관리는 단순해야 한다", "중복성은 파일 시스템에서 처리해야 한다"는 ZFS의 아이디어는 좋습니다. ZFS 디스크에 배드 섹터가 발생하면 자동으로 복구되는 것 같습니다(그렇지 않습니까? 아직 확인할 수 없습니다). ZFS 디스크에 불량 섹터가 점점 더 많이 발생하면 해당 ZFS 디스크의 크기가 줄어든다는 의미입니까? 그렇지 않은 경우 불량 섹터가 발생하면 어떻게 알 수 있습니까? 하드디스크 불량 섹터가 너무 많아서 이를 다른 정상 하드디스크로 교체해야 하는지 어떻게 알 수 있나요? ZFS 모니터와 ZFS 유틸리티가 필요한 것 같은데 인터넷에서 많은 정보를 찾을 수 없습니다.

답변1

데이터 저장이 결국에는 항상 실패할 것이라고 가정한다면,하나 이상의 사본을 보관하십시오데이터를 읽고 가끔 데이터를 성공적으로 읽을 수 있는지 확인하고 확인하십시오.

일부 유형의 RAID를 사용하는 것은 최소한 하나의 백업 복사본을 갖는 좋은 방법처럼 들리지만, 적어도 모든 복사본을 동일한 건물, 방 및 컴퓨터에 보관하지 않는다는 분명한 이유 때문에 추가 복사본을 만드는 것이 좋습니다. 온라인 백업은 다른 사람이 자신의 드라이브 고장에 대해 걱정할 수 있도록 하는 좋은 방법입니다.

데이터를 계속 읽을 수 있는지 확인하려면 체크섬을 유지하고 정기적으로 확인하세요. GNU의 핵심 유틸리티나 md5sum 또는 shaXsum과 같은 기본 CRC는 작동합니다 cksum(불량 섹터 IMO의 경우 과도하지만).

[그리고 분명한 이유로 체크섬 파일의 복사본 몇 개를 보관하십시오.]

ZFS에 자체 체크섬이 있더라도 다른 파일 시스템이나 온라인에 저장된 복사본을 확인하려면 자체 복사본을 보관해야 합니다. 그리고 나는 당신이나 ZFS가 어쨌든 그것을 확인하기 위해 모든 파일을 읽어야 할 것이라고 가정합니다.ZFS 데이터 스크러빙, zpool scrub)를 사용하여 명시적으로 호출됩니다.


많은 드라이브(특히 플래시 드라이브)가 자체적으로 불량 블록 관리(및 마모 평준화)를 수행하고 불량 블록과 주변 블록을 새 예비품으로 교체하며 이 모든 작업은 사용자나 운영 체제가 눈치채지 못하는 사이에 (대부분) 자동으로 수행된다는 점을 고려하는 것도 흥미롭습니다. 플래시 메모리 카드에 대해 읽은 적이 있는데, 16GB 메모리 중에서 512MB 또는 1G 카드를 만들 수 있는 좋은 메모리만 있다는 내용이었습니다.

답변2

RAID 5/6 관련

RAID 5/6에는 패리티 데이터가 있습니다.

전체 디스크를 재구축할 수 있다면 확실히 단일 섹터를 복구할 수 있는 충분한 패리티 데이터가 있습니다.

최악의 경우, 불량 섹터가 전체 드라이브를 교체하는 것을 감지하고 이제 모든 것이 재구축되었습니다.

따라서 RAID 5/6이 불량 섹터를 감지하면~해야 한다자동으로 패리티 데이터를 사용하여 복구합니다.

내 Adaptec RAID 컨트롤러에는 GUI에 특별한 "확인/수정" 옵션도 있습니다.

또한 참고체크섬,sha1,sha2, CRC 등은 오류가 발생한 시기를 감지하는 기능만 제공합니다. 문제를 해결할 수 있는 모든 기능을 제공합니다.

관련 정보