数十万の小さなファイルを持つサーバー間のリアルタイムファイル同期

Question 1

サーバーが同じ LAN 上にある場合は、クラスター化されたファイルシステム (例: GlusterFS) または共有ストレージソリューション (例: NFS 経由) の方が適しています。

サーバーが別の場所にあり、WAN接続のみの場合、上記の解決策はうまく機能しません。この場合、一方向のレプリケーションのみが必要な場合(つまり、アクティブサーバーからバックアップサーバーへ) はlsyncd良い解決策です。別の解決策はですcsync2。最後に、別の可能性はを使用することですDRBD + DRBD Proxy(プロキシコンポーネントは商用プラグインであることに注意してください)。

最後に、サーバーがWAN接続のみで、双方向のレプリケーションが必要です(つまり、両方のサーバーが同時にアクティブになる)、基本的に特効薬は存在しません。いくつかの可能性を挙げますが、同様の設定を推奨するわけではありません。

unisonリアルタイムプラグイン
psyncは、私が同様の問題を解決するために書いたものです（ただし、独自の特異性があるため、サポートなしそれのための）
syncthingリアルタイムプラグインを使用（ただし、ACL やファイルの所有者/グループが保存されないという重大な制限があります）

Answer

サーバーが同じ LAN 上にある場合は、クラスター化されたファイルシステム (例: GlusterFS) または共有ストレージソリューション (例: NFS 経由) の方が適しています。

サーバーが別の場所にあり、WAN接続のみの場合、上記の解決策はうまく機能しません。この場合、一方向のレプリケーションのみが必要な場合(つまり、アクティブサーバーからバックアップサーバーへ) はlsyncd良い解決策です。別の解決策はですcsync2。最後に、別の可能性はを使用することですDRBD + DRBD Proxy(プロキシコンポーネントは商用プラグインであることに注意してください)。

最後に、サーバーがWAN接続のみで、双方向のレプリケーションが必要です(つまり、両方のサーバーが同時にアクティブになる)、基本的に特効薬は存在しません。いくつかの可能性を挙げますが、同様の設定を推奨するわけではありません。

unisonリアルタイムプラグイン
psyncは、私が同様の問題を解決するために書いたものです（ただし、独自の特異性があるため、サポートなしそれのための）
syncthingリアルタイムプラグインを使用（ただし、ACL やファイルの所有者/グループが保存されないという重大な制限があります）

Question 2

私は ZFS ファイルシステムを使用し、zfs 送信/受信フレームワークを使用してブロックレベルのレプリケーションを活用します。

私は便利なスクリプトを使用していますシンコイド要件に応じて、15 秒から 1 時間ごと、または 1 日ごとの間隔でファイルシステムの定期的な同期を実行します。

あなたが言及しているデータセットの場合、ブロックレベルのレプリケーションは rsync よりもクリーンかつ正確になります。

Answer

私は ZFS ファイルシステムを使用し、zfs 送信/受信フレームワークを使用してブロックレベルのレプリケーションを活用します。

私は便利なスクリプトを使用していますシンコイド要件に応じて、15 秒から 1 時間ごと、または 1 日ごとの間隔でファイルシステムの定期的な同期を実行します。

あなたが言及しているデータセットの場合、ブロックレベルのレプリケーションは rsync よりもクリーンかつ正確になります。

Question 3

私の経験から言うと、分散ファイルシステムはアプリケーションに簡単なレプリケーションメカニズムを提供します。ただし、ディレクトリが非常に大きくなり、小さなファイルが多すぎると、特にパフォーマンスが低下します。複数の場所やマシンからのロックや共有アクセスを処理する必要があるため、これは予想どおりです。

Rsync のような方法は、場合によっては、多少の遅延はあるものの許容できるレプリケーションを提供します。レプリケートされたフォルダーの読み取り/書き込み中にアプリケーションのパフォーマンスに影響はありません。

より良い解決策は、1 台のサーバーからアクセス可能な共有ストレージ (手頃な価格の場合) を提供することだと思います。最初のサーバーがダウンしたときに、別のスタンバイサーバーが共有フォルダーをマウントする準備ができています。サーバー間でデータを複製する必要はありません。

Answer

私の経験から言うと、分散ファイルシステムはアプリケーションに簡単なレプリケーションメカニズムを提供します。ただし、ディレクトリが非常に大きくなり、小さなファイルが多すぎると、特にパフォーマンスが低下します。複数の場所やマシンからのロックや共有アクセスを処理する必要があるため、これは予想どおりです。

Rsync のような方法は、場合によっては、多少の遅延はあるものの許容できるレプリケーションを提供します。レプリケートされたフォルダーの読み取り/書き込み中にアプリケーションのパフォーマンスに影響はありません。

より良い解決策は、1 台のサーバーからアクセス可能な共有ストレージ (手頃な価格の場合) を提供することだと思います。最初のサーバーがダウンしたときに、別のスタンバイサーバーが共有フォルダーをマウントする準備ができています。サーバー間でデータを複製する必要はありません。

Question 4

アイデアをありがとうございます。すべて確認してテストしましたが、lsyncd に固執することにしました。

理由:

非常に簡単なインストール
非常に簡単なセットアップ
一方向と双方向のレプリケーションの両方をサポート

Answer

アイデアをありがとうございます。すべて確認してテストしましたが、lsyncd に固執することにしました。

理由:

非常に簡単なインストール
非常に簡単なセットアップ
一方向と双方向のレプリケーションの両方をサポート

数十万の小さなファイルを持つサーバー間のリアルタイムファイル同期

答え1

答え2

答え3

答え4

関連情報