Hyper-V 2012 クラスターの自動フェールオーバーを高速化するにはどうすればよいですか?

Question

振り返ってみると、私は知っているべきだったと思います。答えは 2 つの部分に分かれています。なぜなら、私の考えでは、計画されたフェイルオーバーと「実際の」/計画されていないフェイルオーバーがあり、計画されたフェイルオーバーはカウントされないからです。

計画的なフェイルオーバー

計画的フェイルオーバーは、実際にはクラスタリングシステムがノードを空にして再起動するだけです。したがって、RDP 経由でノードを直接再起動するか、クラスタリングアプリの GUI で「クラスタサービスを停止」すると、最初に VM のライブマイグレーションが行われます。VM のライブマイグレーションだけを行うため、かかる時間は転送する必要がある内容とネットワーク接続によって異なります。1Gb NIC を使用している場合は、しばらく時間がかかります (約 118MB/秒)。VM の RAM が多いほど、より高速なNICによって、より良いサービスが受けられる。

本当のフェイルオーバー

計画外の/「実際の」フェイルオーバーは、マシンのプラグを抜いたときに発生します。その場合、クラスタシステムは自動的に別のノードで VM を起動します。外部に対する動作は、VM を再起動した場合と同じです。VM にとっては、「電源をオフにして」再度起動した場合と同じです。したがって、「実際の」フェイルオーバーは、常に VM の起動にかかる時間に関するものになります。

正接

これは私にとっては概念的にがっかりです。なぜなら、ネット上のクラスタリングに関する話はすべて、(「ハード」) ノード障害はクラスタリングシステムによって隠蔽され、サービスがダウンしなかったかのように見えるように思われるからです。これは、私が読んだ記憶のあるすべての Web ページがソフトウェアでクラスタフェイルオーバーをテストしていた (計画されたフェイルオーバー) という事実によって広まっている可能性があります。つまり、実際に彼らが行っているのは、Live Migration が宣伝どおりに機能する (クライアントの観点からはダウンタイムがない) ことを証明することだけです。

私の主なミスは、フェイルオーバー自体を誤解していたことです。ホット/ウォーム/コールドバックアップサーバーの概念に加えて、ホットサーバーで自動フェイルオーバーが発生するホット/ウォーム/コールドフェイルオーバーもあります。前述のようにここホットフェイルオーバーは瞬時に行われ、ウォームフェイルオーバーは数秒、コールドフェイルオーバーは数分で行われます。自動障害はすべて「ホット」であると想定するのは、私の考えが甘すぎました。RAM で何らかの魔法が起こり、クラスターが別のノードの VM の RAM のコピーを更新する、SQL Server のトランザクションログシッピングのようなものを期待していたのだと思います。ただし、それが確実に機能するには、マシン間の通信チャネルが少なくとも RAM と同じ速度である必要があります。

Answer 1

振り返ってみると、私は知っているべきだったと思います。答えは 2 つの部分に分かれています。なぜなら、私の考えでは、計画されたフェイルオーバーと「実際の」/計画されていないフェイルオーバーがあり、計画されたフェイルオーバーはカウントされないからです。

計画的なフェイルオーバー

計画的フェイルオーバーは、実際にはクラスタリングシステムがノードを空にして再起動するだけです。したがって、RDP 経由でノードを直接再起動するか、クラスタリングアプリの GUI で「クラスタサービスを停止」すると、最初に VM のライブマイグレーションが行われます。VM のライブマイグレーションだけを行うため、かかる時間は転送する必要がある内容とネットワーク接続によって異なります。1Gb NIC を使用している場合は、しばらく時間がかかります (約 118MB/秒)。VM の RAM が多いほど、より高速なNICによって、より良いサービスが受けられる。

本当のフェイルオーバー

計画外の/「実際の」フェイルオーバーは、マシンのプラグを抜いたときに発生します。その場合、クラスタシステムは自動的に別のノードで VM を起動します。外部に対する動作は、VM を再起動した場合と同じです。VM にとっては、「電源をオフにして」再度起動した場合と同じです。したがって、「実際の」フェイルオーバーは、常に VM の起動にかかる時間に関するものになります。

正接

これは私にとっては概念的にがっかりです。なぜなら、ネット上のクラスタリングに関する話はすべて、(「ハード」) ノード障害はクラスタリングシステムによって隠蔽され、サービスがダウンしなかったかのように見えるように思われるからです。これは、私が読んだ記憶のあるすべての Web ページがソフトウェアでクラスタフェイルオーバーをテストしていた (計画されたフェイルオーバー) という事実によって広まっている可能性があります。つまり、実際に彼らが行っているのは、Live Migration が宣伝どおりに機能する (クライアントの観点からはダウンタイムがない) ことを証明することだけです。

私の主なミスは、フェイルオーバー自体を誤解していたことです。ホット/ウォーム/コールドバックアップサーバーの概念に加えて、ホットサーバーで自動フェイルオーバーが発生するホット/ウォーム/コールドフェイルオーバーもあります。前述のようにここホットフェイルオーバーは瞬時に行われ、ウォームフェイルオーバーは数秒、コールドフェイルオーバーは数分で行われます。自動障害はすべて「ホット」であると想定するのは、私の考えが甘すぎました。RAM で何らかの魔法が起こり、クラスターが別のノードの VM の RAM のコピーを更新する、SQL Server のトランザクションログシッピングのようなものを期待していたのだと思います。ただし、それが確実に機能するには、マシン間の通信チャネルが少なくとも RAM と同じ速度である必要があります。

Hyper-V 2012 クラスターの自動フェールオーバーを高速化するにはどうすればよいですか?

答え1

計画的なフェイルオーバー

本当のフェイルオーバー

正接

関連情報