
GCE の「Cloud SQL」製品、特に MySQL フレーバーを検討しています。この製品が非 HA モードでどのように動作するのか、少し混乱しています。
HA モードでは、プライマリ インスタンスが使用できなくなった場合に起動するスタンバイ レプリカが用意されていると理解しています。
しかし、非 HA インスタンスが使用できなくなった場合はどうなるでしょうか? GCE は、最終的には必ず、ある時点でそのインスタンスを再び稼働させるのでしょうか? 再び稼働させた場合、最悪のシナリオは、データが 24 時間前 (最後の毎日のバックアップ) になることでしょうか? それとも、この場合、実際に手動作業が必要でしょうか? たとえば、バックアップに基づいて新しいインスタンスを自分でプロビジョニングする必要があるなどでしょうか?
非 HA モードでは 99.95% の可用性が保証されているように見えます。では、残りの 0.05% の時間をカバーするのは HA モードなのでしょうか?
Cloud SQL は、バックアップ、レプリケーション、暗号化パッチ、容量の増加をすべて自動化し、世界中どこでも 99.95% を超える可用性を保証します。
答え1
しかし、非 HA インスタンスが使用できなくなった場合はどうなるでしょうか?
つまり、インスタンスがオンラインになるまでデータは利用できなくなります。ほとんどの場合、これはユーザーの設定ミスが原因です。ただし、サポートによる確認後にカバーされる場合もあります。HA では、マスターが利用できなくなった場合、マスターが復帰するまでスタンバイがオンラインになります (ダウンタイムは短く、2 分未満になる場合があります)。
再度起動した場合、最悪のシナリオは、データが 24 時間前 (最後の毎日のバックアップ) になるということでしょうか?
バックアップを使用して新しいインスタンスを起動することはいつでも可能ですが、インスタンスが不健全になって復帰した場合、バックアップは取得されず、ダウンタイム前に利用可能な最新のデータで復帰します。通常、インスタンスがオフラインになった場合は、これを上書きすることはできません。
HA モードは、残り 0.05% の時間の間、背中をカバーしてくれるのでしょうか?
両方のモードの SLA は同じです。SLA は完全なダウンタイムをカバーします。たとえば、非 HA インスタンスでは、インスタンスが使用できなくなったため SLA がカバーされますが、HA インスタンスでは、スタンバイとマスターが使用できなくなり完全なダウンタイムが発生した場合にのみ SLA がカバーされます。
詳細については、クラウドSQL SLA