pub/sub サーバーのスケーラビリティに関する懸念は何ですか?

Question

1 つのソケットの実際のメモリ使用量はそれほど多くありません。

メモリを消費するのは、どのクライアントがどの更新に関心があるか、どのクライアントがすでに特定の更新を受信しているかに関連する状態です。

原始的な実装 (つまり、OS ネットワークスタックを使用) では、後者の状態は送信バッファーの形式で保持されます。つまり、更新が 10,000 台のクライアントに送信された場合、データは 10,000 回コピーされ、各コピーは送信キューに追加され、そこで必要なヘッダー (接続ごとの状態を含む) が追加され、次に、ヘッダーとペイロードを連結したパケットを送信するようにハードウェアに指示する記述子が作成されます。

ペイロードのクライアントごとのコピーは、クライアントによって確認されるまでメモリ内に保持され、メモリ要件はそこから発生します。このメモリはページアウトできないため、他のアプリケーションにメモリとキャッシュの負荷がかかります。

サーバープログラム自体の中にネットワークスタックの一部を実装する実装があり、参照カウントやオンデマンドのペイロードの再作成によってコピーを回避できます。これにより、メモリ使用量を大幅に削減できますが、真にスケーラブルにするには多くのトリッキーなコーディングが必要になります。特にマルチソケットサーバーでは、OS ネットワークスタックが既に回避方法を知っている興味深い問題がいくつか発生します。

選択肢

アプリと同じサーバー上でpub/subサービスを実行する
OSネットワークを備えた専用サーバー上でpub/subサービスを実行する
カスタムネットワークを備えた専用サーバー上でpub/subサービスを実行する
複数の専用サーバーでpub/subサービスを実行する

サービスが拡大するにつれて、エスカレーション戦略を立てる必要があります。共有から専用への移行には多くの計画は必要なく、必要に応じて実行できます。移行が完了したら、次の段階を準備します。

複数のサーバーにスケールアップすると、クライアントが異なる順序で更新を受け取る可能性があるため、システムに非決定性が導入されます。そのため、このスケーリング手順を成功させるには、クライアントがこれを認識し、一貫したビューを提示できる必要があります。これが簡単か難しいかは、実際のアプリケーションによって異なります。

要約:時期尚早に最適化する必要はありません。サービスを分割して、スケーリングの最初のステップが単純な構成変更になるようにし、変更が完了したらすぐに最適化を開始します。

Answer 1