高可用性MariaDBは2台のサーバーのみ

Question 1

ノードが 2 つあります。いかなる種類のマスターマスターも使用しないでください。2 つのノードでスプリットブレインが発生する可能性が非常に高くなります (最終的にはほぼ確実に発生します)。

この種のステートフルアプリケーションは、2 ノードクラスターの展開を単独でうまく処理することは期待できません。障害発生時にクラスターを堅牢にするには、オペレーターの介入または CRM のいずれかが必要になります。これが、そもそもクラスター化される理由です。

2ノードのクラスタがあります。このアーキテクチャはスプリットブレイン状態になりやすいため、スプリットブレインについて絶対に心配する必要があります。ノード間のネットワークリンクが現在安定しているからといって、常に安定しているとは限りません。これは、2ノードクラスタにおけるリスクの最大の要素の1つです。このリンクを失うと、次の場合を除き、クラスタは即座にスプリットブレインになります。フェンシングまたは定足数ノード間で確立されます。これは、2 ノードクラスターにおける最大の考慮事項の 1 つです。フェンシングにより、スプリットブレイン状態が発生する可能性が、高いレベルからほぼゼロにまで低下します。

これを Pacemaker/Corosync で処理することをお勧めします。これは複雑なスタックですが、2 つのノードで実稼働レベルのクラスターを生成するために必要なメカニズムを提供します。また、このようなクラスターマネージャーの強制下にある場合でも、マルチマスターではなく、一度に 1 つのマスターインスタンスのみを使用することをお勧めします。

HA MariaDB の優れたガイドがあり、出発点として役立ちます。フェンシングの使用については説明されていません。フェンシングを実現できない場合、Corosync には、投票デーモンを実行する小さなアービトレータノードを使用して、アプリケーションのオーバーヘッドコストなしでクォーラムによる全体的な実装を提供する機能もあります (Corosync qdevice の情報を参照してください)。

サブスクリプションの壁の背後にあるが、一度に 1 つのノードで実行し、ノード間でブロックストレージを複製するアクティブ/パッシブ MySQL クラスタを構成するためのエンドツーエンドのガイド

Pacemaker の高度なリソースタイプは、リソースを線形依存関係チェーンにグループ化する機能や、ノード間でアプリケーションの複数のインスタンスを実行するためのマルチステートリーダー選出セマンティクスを表現する機能により、フェイルオーバーを適切にオーケストレーションする方法に関するほとんどの質問に対応します。それはここにあります。

バンドルは、Docker や RKT などのコンテナランタイムを介して Pacemaker でアプリケーションの分離を実現する方法です。これにより、バンドル自体がクラスターに対して Pacemaker ノードとして表示されるため、他のアプリケーションとは独立してクラスターによって「フェンス」できるため、フェンシングの別の手段が開かれます。それはここにあります。

Answer

ノードが 2 つあります。いかなる種類のマスターマスターも使用しないでください。2 つのノードでスプリットブレインが発生する可能性が非常に高くなります (最終的にはほぼ確実に発生します)。

この種のステートフルアプリケーションは、2 ノードクラスターの展開を単独でうまく処理することは期待できません。障害発生時にクラスターを堅牢にするには、オペレーターの介入または CRM のいずれかが必要になります。これが、そもそもクラスター化される理由です。

2ノードのクラスタがあります。このアーキテクチャはスプリットブレイン状態になりやすいため、スプリットブレインについて絶対に心配する必要があります。ノード間のネットワークリンクが現在安定しているからといって、常に安定しているとは限りません。これは、2ノードクラスタにおけるリスクの最大の要素の1つです。このリンクを失うと、次の場合を除き、クラスタは即座にスプリットブレインになります。フェンシングまたは定足数ノード間で確立されます。これは、2 ノードクラスターにおける最大の考慮事項の 1 つです。フェンシングにより、スプリットブレイン状態が発生する可能性が、高いレベルからほぼゼロにまで低下します。

これを Pacemaker/Corosync で処理することをお勧めします。これは複雑なスタックですが、2 つのノードで実稼働レベルのクラスターを生成するために必要なメカニズムを提供します。また、このようなクラスターマネージャーの強制下にある場合でも、マルチマスターではなく、一度に 1 つのマスターインスタンスのみを使用することをお勧めします。

HA MariaDB の優れたガイドがあり、出発点として役立ちます。フェンシングの使用については説明されていません。フェンシングを実現できない場合、Corosync には、投票デーモンを実行する小さなアービトレータノードを使用して、アプリケーションのオーバーヘッドコストなしでクォーラムによる全体的な実装を提供する機能もあります (Corosync qdevice の情報を参照してください)。

サブスクリプションの壁の背後にあるが、一度に 1 つのノードで実行し、ノード間でブロックストレージを複製するアクティブ/パッシブ MySQL クラスタを構成するためのエンドツーエンドのガイド

Pacemaker の高度なリソースタイプは、リソースを線形依存関係チェーンにグループ化する機能や、ノード間でアプリケーションの複数のインスタンスを実行するためのマルチステートリーダー選出セマンティクスを表現する機能により、フェイルオーバーを適切にオーケストレーションする方法に関するほとんどの質問に対応します。それはここにあります。

バンドルは、Docker や RKT などのコンテナランタイムを介して Pacemaker でアプリケーションの分離を実現する方法です。これにより、バンドル自体がクラスターに対して Pacemaker ノードとして表示されるため、他のアプリケーションとは独立してクラスターによって「フェンス」できるため、フェンシングの別の手段が開かれます。それはここにあります。

Question 2

私は、「問題は気にしない、実行できるのは 2 つのノードだけだ」という同じ哲学で、さまざまな DB (Mongo、Elasticsearch、SQL Server など) を実行しました。

それは本当に苦痛でした。

マスタースレーブで実行する場合は問題ありません。しかし、頭痛の種になります。

何年もこの問題を回避し、2 つのノードのみにこだわったために生じたさまざまな DevOps の頭痛の種に対処した後 (データベースが非常に大きく、3 番目のノードのコストが重大だったため、2 つのノードのみにこだわった)、ついに 3 つのノードを実行し始めました。

そして、すべては良くなりました。

長年のダンスから私が得た教訓は、選択肢は 2 つあるということです。

ウォームっぽいスペアを備えた単一ノード（例：マスタースレーブ）
3つのノード

私の経験から言うと、2 つのノードをアクティブ/アクティブで実行することは二度とないでしょう (私が見たことがある、非常に醜いスプリットブレインを完全に防止する魔法のピースがない限り)。

さまざまなスタック上で複数の 0.5～1.5 TB データベースを 5 年間実行した結果です。

Answer