Cisco WS-C6509-E Arp 快取損壞問題?

Cisco WS-C6509-E Arp 快取損壞問題?

我們的 Catalyst 6500 交換器遇到問題,我們懷疑 ARP 快取已損壞。這會帶來以下症狀:

  1. 當您嘗試ping 之前尚未解析的系統時,第一個ping 回應會逾時,並且後續的每個ping 都會成功: Pinging foo.network.com [xxx.xx.xx.xx] with 32 bytes of data: Request timed出去。 xxx.xx.xx.xx 回覆:位元組=32 時間=5ms TTL=55 xxx.xx.xx.xx 回覆:位元組=32 時間=3ms TTL=55 xxx.xx.xx.xx 回覆:位元組= 32時間=3ms TTL=55

  2. 當發生損壞問題時,每隔一個ping 都會逾時:使用32 位元組資料Ping foo.network.com [xxx.xx.xx.xx]:來自xxx.xx.xx.xx 的回應:位元組=32 時間=5ms TTL =55 請求逾時。來自 xxx.xx.xx.xx 的回覆:位元組=32 時間=5ms TTL=55 請求逾時。

  3. 清除 ARP 快取可以暫時解決該問題。要清除 ARP 緩存,我們使用以下命令:clear arpcacheclearipcache 這解決了這個問題,但它肯定會再次發生。

開關的詳細資訊:

IOS (tm) s72033_rp 軟體 (s72033_rp-PK9SV-M),版本 12.2(17d)SXB8,發佈軟體 (fc2)

思科 WS-C6509-E (R7000) 處理器(修訂版 1.1)

任何協助表示讚賞,謝謝

澄清:我們擁有自己管理的網絡,然後將其連接到公司網路。對我們管理的網路內部機器的所有請求都工作正常。我們只是在其他網路上的機器上遇到問題。

答案1

我建議您向思科立案。
他們將能夠檢查您的 IOS 版本上是否存在已知錯誤,並會詢問您可能不想在此處發布的配置詳細資訊。 (但是如果您願意,您可以將 sh tech 的結果放在某個地方,它可以幫助我們)
另外,它是在重新啟動後追加還是在長時間正常運行後開始損壞?

答案2

  • 您在交換器的 CLI 或連接到交換器的 PC 上的 PING 中遇到此問題嗎?

  • 該交換器是否提供第 3 層(路由)功能?

  • 您顯示的這些 PING 是否在同一子網路或跨子網路的兩個裝置之間有問題?

  • 交換器上的日誌(我相信“顯示日誌歷史記錄”)是否顯示有任何問題?

  • 該問題是否僅影響少數設備的資料包傳送,還是您發現它影響了許多設備?

幾年前,我在客戶網站上遇到了類似的問題。我在問題發生之前捕獲了“show mac-”的輸出,然後在問題發生期間捕獲了“show mac-”的輸出,並比較了在中斷開始之前和之後尋找似乎位於不同端口的設備。

我發現 LAN 上有一個嵌入式裝置(在本例中是時鐘)會定期傳輸一批帶有「欺騙」來源位址的幀,從而混淆交換器的橋接表並導致交換器錯誤地發送幀港口一段時間。我能夠在“show mac-”輸出中看到它,因為注意到不應該更改連接埠的設備似乎正在這樣做。

聽起來解決問題很有趣!希望我在那裡...>微笑<

編輯:

感謝您的評論。

“show log hist”顯示持久性日誌。只要您不清除日誌,清除交換器上的 arp 快取後,報告的任何訊息仍然會存在。

您的 6509 和問題設備所在的公司資料中心之間是否還有其他路由器?

您是否使用任何動態路由協定?

這是我的直覺:

我強烈建議您在發生故障之前保存“show mac-”和“show arp”的副本,並在發生故障時再次保存(使用 PuTTY 之類的工具捕獲它們應該只需要一點時間,所以您可以快速清除arp快取).

我知道您無法輕鬆地在此處發布這些捕獲,但我建議您將它們放入電子表格或資料庫中,並將MAC 位址與一份報告中的連接埠進行匹配,並將MAC 位址與另一份報告中的IP 位址進行比對。如果您比較“之前”和“期間”,我預測您會看到一些差異。

假設您的 6509 和公司資料中心之間有一個路由器,我預測您會發現該路由器的 MAC 位址在連接埠之間“移動”,或者其 IP 位址在 MAC 位址之間移動。

如果沒有路由器並且公司資料中心機器在第 2 層與此 6509 通信,我將預測設備本身可能會在連接埠之間顯示一些“移動”,或在 MAC 位址之間移動 IP 位址。

答案3

如果您在正在 ping 的用戶端上執行嗅探器,您會看到所有 ping 還是只看到一半?

如果從 6500 上的不同介面取得 ping 會發生什麼情況? 6500 是預設閘道的主機是否會出現這種情況?

MAC位址表是什麼樣的?追蹤路由怎麼樣?還有「ping -r9」?

不排除IOS的bug,但也可能是很多其他的原因...

答案4

我必須同意彼得和艾文的觀點。這聽起來更像是彈跳路由/連接埠而不是快取攻擊。尤其是在 65xx 上。為了放大 Evan 的評論,請務必取得(工作)arp 表,但您真正需要的唯一條目是下一跳路由器。排除多路徑問題了嗎?我看到有人問您是否正在運行動態路由協定(或帶有浮動靜態路由的多個網關),但我沒有看到您的答案。祝你好運!

相關內容