有一個Linux盒子。
提供儲存服務的 Netapp 設備故障。
它們位於同一子網路中,因此理論上不需要路由。
問題:有時我們可以從Linux機器存取netapp的LIF,有時我們不能(根據tcpdump,它只是不回應)。
問題:什麼可能導致這樣的問題?
更新#1:創建了有關何時好、何時壞的統計數據,其中:
while true; do (nc -w 1 -z IPADDRESSHERE 22 && printf "good\t") || printf "bad\t"; date; sleep 1; done > testing.txt
因此,每一秒,netcat 都會嘗試從 Linux 盒子連接到 Netapp。
# grep -w bad testing.txt | wc -l; grep -w good testing.txt | wc -l
520
480
#
當嘗試 1000 次時,我們得到了 520 次 SSH,而 480 次則超時,所以大約 52% 是好的,大約 48% 是壞的。也許50-50%?可能是一些類似故障轉移的問題嗎?
更新#2:另一件有趣的事情是,壞的 Netapp 無法 ping 通,而所有其他 Netapp 都可以 ping 通。