ZFS でコピーを作成する方法はありますか?

Question 1

上で説明したオプション 3 がおそらく最善の策だと思います。あなたが望むことの最大の問題は、ZFS が実際にはこのコピーオンライトをデータセット/スナップショットレベルでのみ処理することです。

お使いの環境で適切に機能することを確認しない限り、dedup の使用は避けることを強くお勧めします。私の個人的な経験では、dedup は、ユーザーまたは VM ストアが 1 つ増えるまでは正常に機能していましたが、その後パフォーマンスが急激に低下し、多くの問題が発生しました。最初の 10 人のユーザーでは正常に機能しているように見えても、11 人目 (または 12 人目、13 人目など) を追加するとマシンがダウンする可能性があります。この方法を採用する場合は、実稼働環境を正確に模倣したテスト環境があること、およびその環境で dedup が適切に機能することを必ず確認してください。

オプション 3 に戻ると、この方法で管理する各ファイルシステムツリーを保持するための特定のデータセットを設定する必要があります。設定して初期設定が完了したら、スナップショット (データセットごとに 1 つずつ、わずかに異なる) を作成し、クローンに昇格します。元のデータセットには二度と触れないでください。

はい、このソリューションには問題があります。問題がないとは言いませんが、ZFS の制限を考慮すると、おそらくこれが最善のソリューションです。クローンを効果的に使用している人に関する次の参考資料を見つけました。http://thegreyblog.blogspot.com/2009/05/sparing-disk-space-with-zfs-clones.html

私は btrfs にあまり詳しくありませんが、必要なオプションがサポートされている場合、これらのデータセットをサポートするためだけに別のサーバーを設定し、そのサーバーで Linux と btrfs を使用することを検討しましたか?

Answer

上で説明したオプション 3 がおそらく最善の策だと思います。あなたが望むことの最大の問題は、ZFS が実際にはこのコピーオンライトをデータセット/スナップショットレベルでのみ処理することです。

お使いの環境で適切に機能することを確認しない限り、dedup の使用は避けることを強くお勧めします。私の個人的な経験では、dedup は、ユーザーまたは VM ストアが 1 つ増えるまでは正常に機能していましたが、その後パフォーマンスが急激に低下し、多くの問題が発生しました。最初の 10 人のユーザーでは正常に機能しているように見えても、11 人目 (または 12 人目、13 人目など) を追加するとマシンがダウンする可能性があります。この方法を採用する場合は、実稼働環境を正確に模倣したテスト環境があること、およびその環境で dedup が適切に機能することを必ず確認してください。

オプション 3 に戻ると、この方法で管理する各ファイルシステムツリーを保持するための特定のデータセットを設定する必要があります。設定して初期設定が完了したら、スナップショット (データセットごとに 1 つずつ、わずかに異なる) を作成し、クローンに昇格します。元のデータセットには二度と触れないでください。

はい、このソリューションには問題があります。問題がないとは言いませんが、ZFS の制限を考慮すると、おそらくこれが最善のソリューションです。クローンを効果的に使用している人に関する次の参考資料を見つけました。http://thegreyblog.blogspot.com/2009/05/sparing-disk-space-with-zfs-clones.html

私は btrfs にあまり詳しくありませんが、必要なオプションがサポートされている場合、これらのデータセットをサポートするためだけに別のサーバーを設定し、そのサーバーで Linux と btrfs を使用することを検討しましたか?

Question 2

オプション5が最適です。

オプション 3 の親/子データセットに関しては、クローンを昇格させることができ、クローンされたデータセットの子ではなくなります。それでも余分なブロックは使用されません。 編集：これは親子関係を逆転させるだけで、破壊するわけではないことに注意してください。

圧縮/暗号化されているとコピーが遅くなるという話は、まったくの誤りです。プロセッサはブロックデバイスよりもはるかに高速です (SSD を使用している場合でも)。数値の例をいくつか挙げると、ブロックの読み取りには 10 秒かかりますが、解凍には 1 秒、復号化には 2 秒しかかからないとします。ブロック 1 は 10 秒で読み取られ、CPU に送られます。CPU は解凍と復号化を開始し、その間にディスクはブロック 2 の読み取りを開始します。CPU は 3 秒でタスクを終了し、その後 7 秒間ディスクを待機します。その間、ディスクはブロックが圧縮されているかどうかに関係なく、2 つのブロックの読み取りにまったく同じ時間 (20 秒) を費やしています。

同様に、書き込み中は最初のブロックのみが遅延します。CPU はブロック 1 を圧縮/暗号化してディスクに送信します。ディスクがブロック 1 を書き込んでいる間に、CPU は後続のブロックの圧縮/暗号化を開始します。CPU はディスクが書き込むよりもはるかに速くブロックを処理するため、問題にはなりません。(はい、実際はこれよりも複雑ですが、要点はこれです。)

ご質問の些細な点について長々と説明してしまい申し訳ありませんが、その誤解を解きたかったのです。

Answer