資料庫鏡像問題

資料庫鏡像問題

我們在資料庫鏡像方面遇到了一個奇怪的問題,為了發布這個問題,我必須先解釋我們的架構。

我們有一個兩個節點[NODE 1 和NODE 2] 集群,上面安裝了兩個FCI [SQLPRD01 和SQLPRDO2],這是一個主動/主動集群,即SQLPRD01 的首選所有者是NODE 1,SQLPRD02 的首選所有者集群,即SQLPRD01 的首選所有者是NODE 1,SQLPRD02是NODE2。從這些叢集實例中,我們將資料庫鏡像到不同資料中心的不同集群,以實現災難恢復,該資料中心有兩個節點[NODE 3 和NODE 4],並且安裝了SQLDR01 和SQLDR02,其中NODE 3 作為SQLDR01的首選所有者, NODE 4 作為 SQLDR02 的首選所有者。因此,分別從[SQLPRD01到SQLDR01]和[SQLPRD02到SQLDR02]來建立DB映像。上週我們在SQLPRD02 上遇到了一個問題,其中應用程式逾時並且鏡像將進入斷開連接狀態,但是當我將SQLPRD02 從節點2 故障轉移到節點1 時,鏡像會恢復並且應用程式能夠在沒有任何連接的情況下進行連接。上週是間歇性的,但從昨天開始,問題一直存在,即當我將 SQL 故障轉移到其首選節點 [節點 2] 時,鏡像將處於斷開連接狀態,但在節點 1 上工作正常。

到目前為止,我已解決以下問題,

1) ODBC/UDL/Telnet 從所有 PRD 到 DR 節點均成功,反之亦然。應用伺服器也進行了相同的測試,並且取得了成功。 2) 這些是實體機器,因此我們更換了 PRD 叢集上的 N/W 電纜。 3) 驗證 SQLPRD02 和 SQLDR02 上的 SQL 服務帳戶 [用於鏡像設定] 的權限,它具有 SA 存取權限並連接到端點存取權限。 4) 所有修補程式/修補程式/韌體更新都處於同一級別,SQL 版本為 2102,在 PRD 和 DR 上處於相同級別。 5) 向 MS 提出了一個案例,他們運行了 PSSDiag,但到目前為止他們還沒有找到確鑿的證據。

SQLPRD02 實例上的確切錯誤訊息:

訊息 資料庫鏡像連線錯誤 4 '連線被遠端關閉,或接收資料時發生錯誤:'64(指定的網路名稱不再可用。)'' for 'TCP://SQL Cluster/Network Name對於SQLDR02,連接埠' 。

相關內容