FreeBSD VMware 與 CAM 狀態:SCSI 狀態錯誤

FreeBSD VMware 與 CAM 狀態:SCSI 狀態錯誤

我在 VPS (VMware) 上執行 FreeBSD 10.1-RELEASE-p19。

我的 ISP 經歷了快速的資料成長,一週前這些訊息自發性地開始出現在我們的日誌中。

Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): SCSI status: Busy
Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): Retrying command
Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): WRITE(10). CDB: 2a 00 03 f9 6c 22 00 00 40 00
Sep 25 09:00:50 srv03 kernel: (da0:mpt0:0:0:0): CAM status: SCSI Status Error

有時伺服器與儲存完全失去聯繫,然後出現恐慌並重新啟動。這種情況通常每隔偶數小時發生一次,大概是透過例行工作(遷移/備份)進行的。

直到我的 ISP 增加了更多的儲存系統,這將降低儲存的負載,我真的很想嘗試做一些事情。

我發現了這個,但不確定如何修補/使用這些資訊: https://svnweb.freebsd.org/base?view=revision&revision=278111

我也發現了這個(vfs.unmapped_buf_allowed=0),但我不確定這是否相關? https://www.freebsd.org/releases/10.1R/errata.html#open-issues

camcontrol tags da0 -v

(pass1:mpt0:0:0:0): dev_openings  127
(pass1:mpt0:0:0:0): dev_active    0
(pass1:mpt0:0:0:0): devq_openings 127
(pass1:mpt0:0:0:0): devq_queued   0
(pass1:mpt0:0:0:0): held          -1
(pass1:mpt0:0:0:0): mintags       2
(pass1:mpt0:0:0:0): maxtags       255

gstat發生錯誤時的訊息: 在此輸入影像描述

任何想法、提示、想法都會非常非常非常感激。

謝謝!

答案1

如果您使用 VMWare,因此 mpt(4) 是純虛擬的,我建議將其變更為更簡單的內容,例如 ICH10。

否則,我建議您使用camcontrol tags,增加或減少隊列長度。

如果您選擇使用其他驅動程式重新配置磁碟,請注意 SAS -> SATA 控制器變更可能會導致裝置命名更改,可能/dev/daX會變成/dev/adaX,因此除非您使用 zfs 或透過磁碟標籤安裝磁碟,否則您必須編輯/etc/fstab

至於你的gstat產出 - 顯然有問題,可能是 FreeBSD 中虛擬環境支援的本質問題。 600%負載是無稽之談。我建議您將此問題回報給 FreeBSD Bugzilla。

PS 更改磁碟配置控制器類型的建議仍然有效。聚苯硫醚或。或者我會嘗試將 mpt(4) 的佇列長度設為 128 甚至 64。

相關內容