순환 오프라인 드라이브를 사용한 ZFS 백업

순환 오프라인 드라이브를 사용한 ZFS 백업

현재 괜찮은 가정용 NAS를 설정하는 중입니다. 주요 관심사는 데이터의 무결성이므로 ZFS를 파일 시스템으로 사용하기로 결정했습니다. 불행하게도 이로 인해 하드웨어에 대한 일부 요구 사항(또는 더 정확한 권장 사항)이 적용되어 다소 비싼 솔루션이 됩니다. 이로 인해 유사한 시스템에서 오프사이트 백업을 구현할 수 없으므로 대체 솔루션을 찾고 있습니다.

이상적으로는 이동식 하드 드라이브 3개를 갖고 그 중 하나를 서버 근처에 두고 매주 연결하는 것이 좋습니다. 나머지는 오프사이트에 남아 있으며 가끔씩 교체됩니다. 이로 인해 새로운 데이터가 위험해질 수 있다는 점을 알고 있지만 이를 다른 방법으로 백업할 계획입니다.

문제는 이동식 드라이브에 무엇을 넣어야 하느냐는 것입니다. 처음에는 zpool각각에 하나를 추가하고 사용 zpool send하고 zpool recv업데이트하려고 생각했습니다 .여기. 그러나 백업을 다시 가져와야 할 때 드라이브가 "손상"될 가능성이 매우 높다고 생각하며 ZFS에서 이를 처리해 주기를 바랍니다. 이상적으로는 3개의 이동식 드라이브 모두 최대 2개의 드라이브 스왑 이전에 미러 구성에 있어야 하며, 이를 통해 ZFS는 백업을 복원할 때 이전 데이터의 문제를 해결하기 위해 드라이브를 모두 사용할 수 있습니다. 그러나 드라이브는 동시에 연결되지 않으므로 불가능할 수도 있습니다. ZFS는 내가 원하는 것을 구현하는 수단을 제공합니까, 아니면 다른 방법을 사용해야 합니까?

답변1

불행하게도 이로 인해 하드웨어에 대한 일부 요구 사항(또는 더 정확한 권장 사항)이 적용되어 다소 비싼 솔루션이 됩니다. 이로 인해 유사한 시스템에서 오프사이트 백업을 구현할 수 없으므로 대체 솔루션을 찾고 있습니다.

나는 귀하의 정확한 하드웨어 및 성능 요구 사항을 알지 못하지만, 귀하가 찾고 있는 것이 무엇인지 알고 약간의 단점을 수용할 수 있다면 괜찮은 시스템은 상당히 저렴할 수 있다는 점을 알려드립니다. 구체적으로:

  • 온라인에서 찾은 필요한 RAM의 양은 엄청나게 과장되어 있습니다. RAM은 수십 개의 디스크에 비해 저렴하고 RAM은 성능에 매우 중요하기 때문입니다(ARC 및 중복 제거에 사용됨). 1Gbps 이더넷 링크(~110MB/s)만 포화해야 하고 대부분 스트리밍 작업 부하(RAM 대신 디스크가 지속적으로 액세스됨을 의미)가 있는 경우 4~8GB의 메모리이면 충분합니다(2GB도 여전히 작동할 수 있음). .
  • 7200rpm, SAS 커넥터, 낮은 오류 수 및 200MB/s 처리량을 갖춘 엔터프라이즈 디스크는 좋지만 실제로는 필요하지 않습니다. 5200rpm의 낮은 소비자용 드라이브 2개는 문제 없이 이더넷을 포화시킬 수 있습니다. 무작위 읽기는 속도가 느려지지만 매초마다 다른 파일에 액세스하려는 수백 개의 클라이언트가 없습니다.
  • 8개의 SAS 포트가 있는 LSI의 HBA는 안정적인 선택이지만 가격이 비쌀 수 있습니다. 서버 보드의 대부분의 하드웨어 SATA 포트는 Intel 제품이며 매우 안정적입니다. 또한 전력 소비도 적습니다. 여기서도 SSD가 없거나 다중 경로 또는 확장 기능을 사용하지 않으므로 속도는 중요하지 않습니다.
  • CPU 성능은 거의 의미가 없으며 현재 모든 서버 CPU에는 충분한 성능이 있습니다. 30€ 범위의 일부 듀얼 코어 Celeron은 ECC 메모리도 지원하며, 저전력 Atom SoC나 AMD의 저전력 듀얼 코어 또는 쿼드 코어를 사용할 수 있습니다. 또한 이러한 보드에는 이미 6개의 SATA 포트와 향후 확장을 위한 PCIe 1개가 있으며 CPU, 메모리 및 전원 공급 장치를 포함하여 약 300€에 16~64GB의 메모리를 지원합니다.
  • 그 외에도 Dell이나 HP와 같은 대기업에서 제공하는 SoHo 서버 제품 중 일부는 케이스, 디스크, 보증을 포함하여 전체 서버를 300€(규모의 경제)에 구입할 수 있습니다. 확장 옵션은 제한되어 있지만 디스크 4~6개면 여전히 충분합니다.
  • 마지막으로, 전력 가격이 저렴한 곳에 살고 있다면 중고 기업용 하드웨어를 살펴볼 수도 있습니다. 이러한 시스템은 빠르고 내구성이 뛰어나며 저렴하지만 시끄럽고 전력 소모가 많습니다. 트레이드오프가 그만한 가치가 있는지 계산해야 합니다.

그러나 백업을 다시 가져와야 할 때 드라이브가 "손상"될 가능성이 매우 높다고 생각하며 ZFS에서 이를 처리해 주기를 바랍니다. 이상적으로는 3개의 이동식 드라이브 모두 최대 2개의 드라이브 스왑 이전에 미러 구성에 있어야 하며, 이를 통해 ZFS는 백업을 복원할 때 이전 데이터의 문제를 해결하기 위해 드라이브를 모두 사용할 수 있습니다.

내 눈에는 최소한 양방향 미러와 3개의 오프사이트 디스크가 있는 라이브 시스템이 동시에 종료될 가능성은 거의 없습니다. 백업 중 하나를 계속 사용할 수 있는 경우 일주일 동안의 데이터만 손실되며 이는 훨씬 덜 심각합니다(예: 새로 수정된 파일만 차등 온라인 백업하여 완화할 수 있음).

그러나 그런 일이 발생한다고 가정하고 가능한 모든 백업 구성을 비교해 보겠습니다(각각 라이브 시스템에 2개의 디스크가 미러로 있고 5개의 디스크가 모두 동일한 크기라고 가정).

3개의 독립 디스크, send/recv는 데이터를 3개의 풀에 동기화하는 데 사용됩니다.

  • 디스크는 비트 오류를 ​​수정할 수 없지만 오류를 감지할 수 있으며 다른 디스크에서 파일을 복원할 수 있습니다.
  • 독립적이므로 세 위치에 보관하고 세 가지 다른 백업을 가질 수 있습니다(사용자 오류, 소프트웨어 버그 관련).
  • 각 디스크/풀이 동일한 방식으로 처리되므로 처리가 간단합니다.

3개의 디스크를 미러로 사용하고 데이터를 1개의 풀에 동기화하는 데 send/recv를 사용합니다.

  • 본질적으로 복원력이 매우 뛰어난 완전한 오프라인 시스템
  • 반면에 계란은 한 바구니에 모두 담겨 있습니다(도난/화재).

연결된 질문에 설명된 대로 성능이 저하된 미러인 디스크 3개

  • 장점과 단점에 대해서는 연결된 답변을 참조하세요.
  • 또한 버전이 하나만 있습니다.

요약하자면, 요구 사항에 더 중요한 것이 무엇인지에 따라 달라집니다. 즉, 여러 개의 독립적인 시점 또는 장애에 대해 더 탄력적인 단일 시점이 있습니다.

두 번째 솔루션을 선택하는 경우 정기적인 데이터 스냅샷을 활성화하여 암호화 맬웨어(여러 디스크를 사용하면 다소 완화될 수 있음)와 같은 항목으로부터 보호해야 합니다. 또한, 화재/도난/분실을 방지하기 위해 3개의 디스크를 분산하여 서로 다른 장소에 보관하십시오.

관련 정보