Aレコードに複数のIPを持つプライベートDNS Azureが期待通りに動作しない

Question 1

1つのAレコードに2つのIPを入力できると読みました

いいえ、同じ名前で異なる値を持つ複数の A (または CNAME、TXT、MX) レコードを作成できます。

VM IP1 の電源がオフの場合、クライアントは IP2 に解決できると予想しましたが、そうはなりませんでした。"sql.domain.local" に ping を実行すると、この VM がオフであるにもかかわらず、常に IP1 に解決されます。

特定の名前に対して複数のアドレスが提示された場合、クライアントはすべき順番に試してみましょう。これはRFC 1794Ping は低レベルの診断ツールです。ここでの動作が意図的なものなのか、時代錯誤的なものなのか、あるいは単に欠陥があるのかを判断するには、かなりの調査が必要になります。

ブラウザの動作は大きく異なります。ラウンドロビンDNS（rrDNS）は、HTTP[s]サービスの高可用性をサポートするのに非常に効果的なツールです。しかし、それはブラウザが障害検出を実装しているためです。多くの他の TCP クライアントよりも短いタイムアウト (<1 秒)。ほとんどのオペレーティングシステムのデフォルトの TCP 構成では、障害検出タイムアウトは 5 分以上です。また、これは TCP クライアントが適切に RFC に準拠していることを前提としています。私の経験では、Java (または Java 上で実行されるアプリケーションコード) は DNS 解決を期待どおりに処理しません。

外部クライアントに HA アクセスを提供するための高価な代替手段は、TCP マルチパスを使用することです。IME では、2 つの異なるプロバイダーを使用した場合、フェイルオーバーの検出/切り替えには少なくとも 3 分かかり、まったく実行されないこともありました。

rrDNS は外部クライアントに高可用性を提供するための優れたソリューションですが、特定のインフラストラクチャ内のノード間の接続に高可用性を提供する手段としては使用しません。

しかし、外部ロードバランスを使用するためにSQLにパブリックIPを割り当てたくありません

DBMSサーバーをパブリックアドレスに公開しないのは賢明です。他の手段で接続できないということではありません。実際、DBMSにトランザクションデータがある場合は、本当にデータベースノード間の通信を確保できる必要があります。これが vnet ピアリング経由で利用可能であり、アプリケーションが固有の HA クライアント機能をサポートしていない場合は、haproxy または ProxySQL を検討してください。

一方、アプリケーションがアプリケーションサーバーと DBMS 間の遅延に多少影響を受けやすい場合があります (たとえば、単純な ORM を使用している場合)。その場合、場所 'A' のアプリケーションサーバーが場所 'B' の DBMS に接続できるようにするのは望ましくありません。この場合、分離されたスタックへの rrDNS によって部分的に問題を解決できますが、フェイルオーバー/フェイルバック中のセッション管理とデータレプリケーションについても考慮する必要があります。

Answer