オフラインドライブを回転させる ZFS バックアップ

オフラインドライブを回転させる ZFS バックアップ

現在、きちんとしたホーム NAS をセットアップ中です。主な懸念はデータの整合性であるため、ファイルシステムとして ZFS を使用することにしました。残念ながら、ハードウェアにいくつかの要件 (正確には推奨事項) が課せられ、かなり高価なソリューションになります。このため、同様のシステムでオフサイト バックアップを実装することができず、代替ソリューションを探しています。

理想的には、取り外し可能なハード ドライブを 3 つ用意し、そのうち 1 つはサーバーの近くに置き、週に 1 回程度接続します。他のドライブはオフサイトに置き、定期的に交換します。新しいデータにリスクがあることは承知していますが、別の方法でバックアップする予定です。

zpool問題は、リムーバブルドライブに何を置くべきかということです。最初は、それぞれに を置いて、zpool sendと を使用しzpool recvて更新することを考えました。ここただし、バックアップを戻す必要があるときにドライブが「破損」している可能性は十分にあると思います。そのため、ZFS でその処理を行いたいと考えています。理想的には、3 つのリムーバブル ドライブすべてが、2 ドライブ スワップ前までミラー構成になっている必要があります。これにより、ZFS はバックアップを復元するときに、それらすべてを使用して古いデータの問題を修正できます。ただし、ドライブが同時に接続されることはないため、これは不可能かもしれません。ZFS は、私が求めているものを実装する手段を提供していますか、それとも別の方法を使用する必要がありますか?

答え1

残念ながら、これによりハードウェアにいくつかの要件 (正確には推奨事項) が課せられ、かなり高価なソリューションになります。これにより、同様のシステムでオフサイト バックアップを実装することができなくなり、代替ソリューションを探しています。

ハードウェアとパフォーマンスの正確なニーズはわかりませんが、何を求めているかわかっていて、多少の欠点を許容できるなら、まともなシステムはかなり安価になる可能性があることに注意してください。具体的には、次のとおりです。

  • オンラインで見つかる必要な RAM の量は、非常に誇張されています。これは、RAM は数十のディスクに比べて安価であり、パフォーマンスにとって RAM が重要であるためです (ARC と重複排除に使用されるため)。1 Gbps イーサネット リンク (約 110 MB/秒) を飽和させるだけでよく、ワークロードの大部分がストリーミングである場合 (つまり、RAM ではなくディスクが常にアクセスされる場合)、4 ~ 8 GB のメモリで十分です (2 GB でも機能する可能性があります)。
  • 7200 rpm、SAS コネクタ、エラー数が少なく、スループットが 200 MB/秒のエンタープライズ ディスクは便利ですが、実際には必要ありません。2 つの低速な 5200 rpm コンシューマー ドライブで、問題なくイーサネットを飽和させることができます。ランダム読み取りは遅くなりますが、毎秒さまざまなファイルにアクセスしようとするクライアントが何百人もいるわけではありません。
  • 8 つの SAS ポートを備えた LSI の HBA は信頼できる選択肢ですが、高価になる場合があります。サーバー ボード上のハードウェア SATA ポートのほとんどは Intel 製で、信頼性も非常に高くなっています。消費電力も少なくなっています。ここでも、SSD やマルチパス、エクステンダーは使用していないため、速度は重要ではありません。
  • CPU パワーはほとんど意味がありません。現在のサーバー CPU はすべて十分なパワーを持っています。30 ユーロ台の一部のデュアルコア Celeron は ECC メモリもサポートしています。それ以外にも、低電力の Atom SoC や AMD の低電力デュアルコアまたはクアッドコアを使用できます。これらのボードには、後で拡張できるように 6 つの SATA ポートと PCIe がすでに備わっていることが多く、16 ~ 64 GB のメモリもサポートされています。CPU、メモリ、電源を含めて約 300 ユーロです。
  • それ以外にも、Dell や HP などの大企業が提供している SoHo サーバーもあり、ケース、ディスク、保証を含めて 300 ユーロ (規模の経済性) でフル サーバーを入手できます。拡張オプションは限られていますが、4 〜 6 台のディスクでも十分です。
  • 最後に、電気代が安いところに住んでいるなら、中古のエンタープライズ ハードウェアを検討してみてはいかがでしょうか。こうしたシステムは高速で耐久性があり、安価ですが、騒音が大きく、電力を大量に消費します。トレードオフに見合う価値があるかどうか計算する必要があります。

ただし、バックアップを戻す必要があるときにドライブが「破損」している可能性は十分にあると思うので、ZFS でその処理をしたいと考えています。理想的には、3 つのリムーバブル ドライブすべてが、2 回のドライブ交換前までミラー構成になっている必要があります。そうすることで、バックアップを復元するときに、ZFS がそれらすべてを使用して古いデータの問題を修正できるようになります。

私の考えでは、少なくとも 1 つの双方向ミラーと 3 つのオフサイト ディスクを備えたライブ システムが同時に停止する可能性は非常に低いです。バックアップの 1 つがまだ使用可能であれば、1 週間分のデータが失われるだけで済み、それほど深刻ではありません (たとえば、新しく変更されたファイルのみの差分オンライン バックアップによって軽減できます)。

しかし、それが起こると仮定して、すべての可能なバックアップ構成を比較してみましょう (ライブ システムにミラーとして 2 つのディスクがあり、5 つのディスクがすべて同じサイズであると仮定します)。

3つの独立したディスク、送信/受信は3つのプールへのデータの同期に使用されます

  • ディスクはビットエラーを修正することはできませんが、ビットエラーを検出し、他のディスクからファイルを復元することができます。
  • 独立しているため、3 つの場所に保存して、3 つの異なるバックアップ (ユーザー エラー、ソフトウェア バグに関するもの) を作成できます。
  • 各ディスク/プールは同じように扱われるため、取り扱いは簡単です。

3 つのディスクをミラーとして使用し、送信/受信を使用して 1 つのプールにデータを同期します。

  • 本質的には完全なオフラインシステムであり、非常に優れた回復力を備えている
  • 一方、すべての卵を一つのバスケットに入れている(盗難/火災)

リンクされた質問に記載されているように、劣化ミラーとして3つのディスク

  • 長所と短所についてはリンク先の回答をご覧ください
  • バージョンも1つしかありません

つまり、要約すると、複数の独立した時点、または障害に対してより耐性のある単一の時点のどちらがニーズにとってより重要であるかによって異なります。

2 番目のソリューションを選択する場合は、暗号化マルウェアなどから保護するために、定期的なデータ スナップショットも有効にしてください (複数のディスクを使用することで、ある程度軽減されます)。また、火災、盗難、紛失を防ぐために、3 つのディスクを分散して別の場所に保管してください。

関連情報