UCS FC 適配器中止

Question

這是關於這個的故事：

我從錯誤的角度看待它。適配器中止正常症狀，表示某處的某些組件沒有跟上。在這種情況下，適配器中止是 SAN 前端連接埠太繁忙而無法滿足請求的症狀。一些不同的條件使情況變得更加複雜。

1) 錯誤的驅動程式 - 我們的 UCS 韌體層級規定了 ESXi 中的匹配驅動程序，該驅動程式存在從中止恢復的已知問題，將其發送到只能透過重新啟動才能清除的循環中。

2) 變數太多 - 三個 SAN，三個不同的問題都以適配器中止為代表。

3) SAN 錯誤 - 由於 EMC VNX 程式碼中的錯誤導致出現問題，我們不得不停用 VAAI。

2015年編輯：

我想更新這個帖子，因為也有很多新資訊被曝光，而檢測是非常困難的。我希望這篇文章能夠引導一些人走向正確的方向。

1）上述所有內容實際上仍然相關，盡快將所有這些平方並放入支援矩陣內。

2) 某些 UCS 2.1 版本會意外關閉（儘管 NXOS 仍被配置為執行此操作）優先流量控制，這會導致某些 FCoE 流量被像其他流量一樣對待，因此有時會出現亂序 FC 訊框。

3) 在 UCS 2.1 代碼中間的某個位置，IO 節流設定從裝飾欄位變成活動欄位。舊的「燒入」韌體設定是 IO Throttle 計數為 256，所有主機幾乎都使用該計數，儘管 Windows 驅動程式確實允許您對此進行調整。在此代碼中間的某個位置，用於將“256”安裝到硬體中的原始預設值“16”變成了無效設置，UCSM 代碼開始將其解釋為“2048”，這是最大值。結果是，單一 UCS VIC 適配器被配置為完全破壞我們的儲存陣列。

因此，請閱讀您的發行說明。吸取教訓，我們終於解決了這個問題。

IO 節流錯誤：https://tools.cisco.com/quickview/bug/CSCum10869

PFC 錯誤：https://tools.cisco.com/quickview/bug/CSCus61659

Answer 1