對 Windows 2003 中網路連線遺失進行故障排除 - 還需要檢查什麼?

對 Windows 2003 中網路連線遺失進行故障排除 - 還需要檢查什麼?

我們的資料中心面臨著一個奇怪的問題。我們的備份伺服器(執行 EMC Networker)每隔一天凌晨 3:00 左右就會失去網路連線(備份計畫從午夜開始)。中斷2小時後,網路連線自動恢復並恢復正常。

我們觀察到的情況:

這不太可能是網路問題,因為它直接連接到伺服器場交換器(第 2 層連接,沒有任何中間躍點)。此外,伺服器還連接到兩台不同的交換機,以使用 Broadcomm Teaming 進行負載平衡。

a) 如果是與交換器相關的問題,則兩個網路連接埠不太可能都關閉,因為它們連接到不同的交換器。

b) 也排除了 Vlan 範圍問題的可能性,因為同一 Vlan 中的其他設備都沒有問題。

c) 交換器介面狀態永遠為up。但在中斷期間有大量資料包遺失 - 可能是由於備份伺服器的介面利用率較高(接近 100%)

d) 連線恢復,網路沒有任何變更。

下一個嫌疑點是 Windows 伺服器上的資源利用率。 CPU和記憶體都很少超過80%,但網卡利用率卻高得驚人(接近100%)

不太確定如何調查此事?

答案1

我懷疑驅動程式有問題或雙工不匹配。嘗試升級驅動程式並檢查兩端的雙工是否相同。也要檢查交換器的乙太網路統計資料(如果有錯誤、衝突等......)。

什麼意思失去網路連接?無法訪問,但是介面up了?網路可達但丟包較多?

答案2

您嘗試更換網路卡嗎?

答案3

您如何判斷它失去了網路連線?你這到底是什麼意思?你有什麼東西在監視它並告訴你它無法到達嗎?事件日誌中是否有任何內容,如果有的話是什麼?

如果網路利用率很高,即達到完全飽和的程度,您可能會看到連線似乎已斷開的情況。不過根據你的描述很難判斷。但我的猜測是你的備份工作正在最大化你的管道。您是否有每隔一天執行一次的備份作業:)

答案4

它是什麼樣的開關?

發生此特定問題時,同一交換器上的其他設備是否遇到任何通訊問題?儘管這種情況很少見且不太可能發生,但您可能會耗盡該交換器上的有限資源,並在某種意義上對自己進行 DOS 操作。

另外,如果您有防止 DOS 攻擊的機制,那麼它們實際上可以對有問題的伺服器進行黑洞攻擊,直到使用模式恢復正常。

相關內容