Linux に適したフェイルオーバー / 高可用性ソリューションはありますか?

Question 1

http://linux.ha.org/ よりあらゆる高可用性のニーズに対応します。歌にあるように、人生で最高のものは無料です。

Answer

http://linux.ha.org/ よりあらゆる高可用性のニーズに対応します。歌にあるように、人生で最高のものは無料です。

Question 2

私は Linux 上でさまざまなクラスタソリューションを使用してきました。また、私は構成管理の支持者でもあるので、説明の中でそれについても少し触れておきます (Chef または Puppet について)

Veritas Cluster Server (VCS)。しばらく経ちましたが、RHEL 3.0 に Linux VCS クラスターをいくつか導入しました。RHEL 5.0 でも利用できるといいのですが。これは慣れたものなので、セットアップの難しさはよくご存知でしょう。ご存知のとおり、VCS は高価です。逸話的に、VCS は構成管理によるセットアップには適していません。

RHEL について言えば、Red Hat Cluster Suite は RHEL 2.1 での最初のリリース以来、大きく成熟しています。セットアップ/構成フェーズは非常に簡単で、ドキュメントは非常に完全で役に立ちます。また、VCS と同様に、ベンダーからサポートを購入できます。商用 HA 製品としては、RHCS は手頃な価格です。私は、構成管理を使用してパッケージをインストールし、Web インターフェイスを通じて「手動で」保守するだけです。また、Red Hat 以外のプラットフォームで使用している人がいると聞いたことがありますが、私は直接の経験はありません。

Linux-HA (drbd/heartbeat) も優れていますが、VCS から来たため、構成は単純ですが扱いにくいように見えるかもしれません。これは、構成管理ツールを使用すると非常に簡単に自動化できます。

概念実証として、IBM の HACMP (同社の AIX クラスタリングソフトウェア) を使用して Linux クラスタをインストールしました。これはお勧めしません。VCS よりも高価だったと記憶しています。IBM には HACMP のインストールと保守に関する特定の手順があるため、ここでは構成管理は使用しません。

Answer

私は Linux 上でさまざまなクラスタソリューションを使用してきました。また、私は構成管理の支持者でもあるので、説明の中でそれについても少し触れておきます (Chef または Puppet について)

Veritas Cluster Server (VCS)。しばらく経ちましたが、RHEL 3.0 に Linux VCS クラスターをいくつか導入しました。RHEL 5.0 でも利用できるといいのですが。これは慣れたものなので、セットアップの難しさはよくご存知でしょう。ご存知のとおり、VCS は高価です。逸話的に、VCS は構成管理によるセットアップには適していません。

RHEL について言えば、Red Hat Cluster Suite は RHEL 2.1 での最初のリリース以来、大きく成熟しています。セットアップ/構成フェーズは非常に簡単で、ドキュメントは非常に完全で役に立ちます。また、VCS と同様に、ベンダーからサポートを購入できます。商用 HA 製品としては、RHCS は手頃な価格です。私は、構成管理を使用してパッケージをインストールし、Web インターフェイスを通じて「手動で」保守するだけです。また、Red Hat 以外のプラットフォームで使用している人がいると聞いたことがありますが、私は直接の経験はありません。

Linux-HA (drbd/heartbeat) も優れていますが、VCS から来たため、構成は単純ですが扱いにくいように見えるかもしれません。これは、構成管理ツールを使用すると非常に簡単に自動化できます。

概念実証として、IBM の HACMP (同社の AIX クラスタリングソフトウェア) を使用して Linux クラスタをインストールしました。これはお勧めしません。VCS よりも高価だったと記憶しています。IBM には HACMP のインストールと保守に関する特定の手順があるため、ここでは構成管理は使用しません。

Question 3

マイケルの言う通り、コミュニティは現在少し分裂しており、ドキュメントも少々不足しています。

実際、すべてそこにありますが、理解するのは不可能です。本当に必要なのは、「Pacemaker 構成の説明」電子書籍です... (PDFへのリンク）。まずはこれを 12 回ほど読んで、実際に実装してみて、さらに 12 回ほど読んで、実際に理解できるようにしてください。

現時点で Linux 向けのクラスタサービスの最もよくサポートされている実装は、おそらく Novell の SLES11 とその High Availability Extension (HAE) でしょう。これは 1 ～ 2 か月前にリリースされたばかりで、セットアップ方法と実行方法を説明した 200 ページの分厚いマニュアルが付属しています。Novell はさまざまな形式で Pacemaker 構成のサポートにも優れています。

それ以外にも、同じパッケージと適切なドキュメントを備えた RHEL5 の実装がありますが、SLES よりも高価だと思います。少なくとも、私たちにとってはそうです。

現時点では Heartbeat を避けて Pacekmaker/OpenAIS を使用することをお勧めします。将来的には、これらの方がはるかにサポートが充実するからです。ただし、コミュニティの現状は、専門家が数人、実稼働環境で実行している人が数人、そしてまったく無知な人が大勢いるという状況です。Pacemaker のメーリングリストに参加して、Andrew Beekhof という人物に注目してください。

要求された詳細を入力するために編集します:

Pacemaker/OpenAIS は、リソースの動作を追跡するために、「基本リソース」(例: nfs-server) の「モニター」操作を使用します。例の NFS サーバーがクラスターの残りの部分に対して X 秒間応答しなくなった場合、クラスターは STONITH (Shoot The Other Node In The Head) 操作を実行してプライマリノードをシャットダウンし、セカンダリノードをアクティブにします。構成で、その後に起動するものと、それに関連するアクションを決定します。そこからの実装の詳細は、フェールオーバーしようとしているサービス、特定の操作の実行ウィンドウ (プライマリノードをマスターに戻すなど) によって異なりますが、全体として可能な限り構成可能です。

Answer