半隨機連接丟失

半隨機連接丟失

我遇到了令人困惑的網路問題。

就背景而言,我在一個廣播電台集群(一個地點有多個電台)工作,我們大量使用互聯網來提供音訊內容。我們將3 個無線電源傳輸到在線源,將兩個不同的源推送到兩個不同的塔站點,在其中通過空中廣播音頻,接收兩個音頻源(有時是3 個),並將一個源發送回其源。所有這些串流媒體都是 24/7 的,所以我們比普通人使用網路的時間要多一些。我們永遠不會停止廣播——除非失去聯繫。

一段時間以來,我們一直遭受連接損失的困擾,這對於專業廣播電台來說是一個很大的問題。我們已致電網路服務供應商尋求答案,但每次嘗試讓他們調查問題卻空手而歸。

起初,我認為問題只是丟包。但後來我注意到連接丟失只是半隨機的,並且存在某種模式。每個電台都連接到一個無聲感應器,如果某個電台停播,該感應器就會發出警報。這些警報可能意味著不同的事情;但對我們來說,警報僅意味著我們的網路連線中斷。為了解決此問題,我使用從從另一個位置接收音訊的兩個電台收集的資訊。當我們停止從來源接收音訊時,就會發出警報。

首先,連線問題並非完全隨機,因為在大多數情況下,連線中斷僅發生在新的一小時開始前 2 分鐘(12:58、4:58、1:58)。我想說,至少 90% 的情況下,連線問題會在新的一小時前大約 2 分鐘發生。但我必須檢查一下才能確定。對我來說,一小時前兩分鐘失去聯繫已經夠奇怪的了,但還有更多。

連線中斷不會每小時發生,甚至不會在每天的同一時間發生。連線中斷的時間每天都有所不同。更奇怪的是,一個站點可能在一小時結束前2分鐘出現網路中斷,而另一個站點卻沒有出現中斷。事實上,儘管每個電台都會在新的一小時前 2 分鐘失去連接,但我認為我從未聽說過兩個電台同時中斷的情況。因此,連線問題不僅發生在一天中的隨機時間,而且還發生在每個站點的不同時間。唯一的共同點是連線遺失發生在「一」小時結束前約 2 分鐘。

我現在不在車站,所以我無法提供我們正在使用的確切設備,但設定相當簡單。

我們有一個連接到 Netgear Prosafe 24 連接埠切換器的數據機。然後切換器為大樓內的各個房間供電。一般每個房間都有一個小型4-8口切換器(各種品牌)。然後,接收音訊的音訊處理設備連接到這些較小的切換器。

我在這裡完全不知所措。我甚至無法說服康卡斯特這不是我們的錯。現在,我正在考慮在周末斷開 24 埠切換器的連接,並僅使用調變解調器背面的四個連接埠來為重要/基本設備供電(我認為我必須保持至少一個較小的切換器連接, 儘管)。我想,如果問題仍然存在,康卡斯特將不得不承擔責任,因為不會有任何干預技術。

任何幫助都將是巨大的祝福!為什麼問題是半隨機的?我該從哪裡開始尋找問題的根源?我對調製解調器有點懷疑;我認為問題是在更換調變解調器時開始發生的。但最終,我迷失了……迷失了……迷失了。

答案1

從隔離問題開始。我將從邏輯上將網路分解為從外部開始並用於文件/邏輯流的部分:

  • 網際網路(8.8.8.8 是 google DNS 伺服器 - 永不停機)
  • 從您的 ISP 連接設備一跳進入您的 ISP 網絡
  • 您的數據機
  • 您的路由器/NAT 設備
  • 您的內部網路(192.168.xx、172.20.xx、10.xxx)

理解了這種故障,我們開始弄清楚我們擁有什麼......相反:從內到外。所以...

使用 ipconfig 命令

從內部設備 (PC) 根據該設備/PC 確定您的網路狀況運行|命令Enter ipconfigEnter

這將為您提供 IP/子網路/網關(如果您停用第一層故障排除,我們希望您沒有使用無線網路)。

應該看起來像這樣:

Windows IP Configuration

Ethernet adapter Ethernet:

   Connection-specific DNS Suffix  . :
   Link-local IPv6 Address . . . . . : removed
   IPv4 Address. . . . . . . . . . . : 192.168.0.100
   Subnet Mask . . . . . . . . . . . : 255.255.255.0
   Default Gateway . . . . . . . . . : 192.168.0.1

確保您正在使用乙太網路/本地連接設備,而不是其他任何設備。您所在的裝置是 IPv4 位址:192.168.0.100 您的 NAT 裝置/路由器是預設閘道:192.168.0.1

使用 ping 命令

現在我們開始測試網路設備和 NAT/路由器設備之間的連接性。在命令提示字元中,我們將使用 ping 命令類型:

ping 192.168.0.100 -t 

或者

ping -t 192.168.0.100

基本上,您所做的就是向設備打招呼,您在嗎,並且該設備應該做出響應(直到我們進入互聯網中間,事情可能會變得有趣)

良好的回應:

Reply from 192.168.0.100: bytes=32 time<1ms TTL=64

不良反應:

Destination Host Unreachable

或者

Request timed out

或其他任何東西

此命令中的 -t 表示每 1 秒發送一個訊息包,直到您告訴它停止(Ctrl+c或使用 X 關閉視窗)。如果沒有-t,它只會處理 4 個資料包並停止。

現在我們知道如何測試鏈接,我們將對網路中的每個鏈接/連接使用 ping 命令,看看從哪裡開始出現問題。

使用tracert指令

我們需要做的最後一件事是確保您和互聯網之間的連結中沒有其他任何奇怪的東西(所謂的雙 NAT 或兩個 NAT 設備),並確定哪個設備位於您的 ISP 數據機之外。

在命令提示字元下輸入:

tracert google.com<kbd>Enter</kbd>

你會得到類似的東西:

tracert google.com

Tracing route to google.com [74.125.21.138]
over a maximum of 30 hops:

1    <1 ms    <1 ms    <1 ms  router [192.168.0.1]
2     2 ms     1 ms     1 ms  device [10.1.10.1]
3     1 ms     1 ms     1 ms  blah.somename.whatever [123.123.123.123]
4     1 ms     1 ms     1 ms  124.124.124.124
5     *        *        *     Request timed out.

....還會有更多,使用Ctrl+C停止

您關心的是每行 [] 之間的設備的 IP 位址。注意:如果上面ipconfig 測試中的預設閘道IP 後面的行與192.168.xx、172.20.xx、10.xxx 模式(私人不可路由子網路)之一匹配,則您擁有雙重NAT,這可能會導致其他奇怪的問題,我不會在這裡討論這個。

需要的最後一個資訊是您網路的公共 IP。請至 www.ipchicken.com。該號碼就是您的公用 IP。

現在有了所有這些信息,我們要測試什麼?

  1. 你自己(我通常會跳過這一點,除非下一個出現問題):192.168.0.100

  2. 您與 NAT 路由器的連線:192.168.0.1

  3. ipchicken號碼:123.123.123.125

  4. ISP 數據機(您的公共閘道)以外的第一跳:123.123.123.123

  5. 谷歌的DNS伺服器:8.8.8.8

因此,使用上述 ping 測試時,最多開啟 5 個命令提示字元窗口,使用 ping 測試每個躍點。讓我再次將這些躍點放入每個裝置之間可能出現的問題

ping 192.168.0.100

- 如果這不是 100%,則表示您有 NIC 問題,或 IP 堆疊損壞,需要重建

ping 192.168.0.1

- 如果這不是 100%,則表示您的 PC 和交換器/路由器之間存在內部接線問題。開始追蹤並更換網路電纜/交換器/路由器。 - 如果您在這裡有雙 NAT,這將成為後續躍點的問題

ping 123.123.123.125

- 您的 ISP 數據機有問題,請對其進行測試 - 用網路分段的術語來說,我們正在跨越 DMARC 或您本地公司網路(您的 IT 人員的問題)和 ISP 網路之間的界限。

ping 123.123.123.123

- 您的網路連線有問題,ISP 需要登入並檢查您的網路連線。您的數據機與下一組 ISP 設備沒有良好的連接,他們需要進行故障排除。 - 有線 ISP 您需要檢查功率(通常 +-10)和 SNR(信噪比),他們應該告訴您他們所謂的可接受範圍。如果不在範圍內,則需要部署 ISP 技術。 - DSL,您需要讓他們檢查噪音曲線,並且它需要在他們的規格範圍內。在所有插入電話線的設備上安裝過濾器將是一個可能的問題。

ping 8.8.8.8

這是在網路上的某個地方,ISP 會否認是否是他們的合理性,進一步查看 Tracert 鏈可以幫助您開始了解問題開始發生的位置。如果您有幸看到網路邊界發生變化,這些名稱將幫助您識別網路邊界。

歡迎來到 IT 產業:)

相關內容