리눅스 박스가 있습니다.
스토리지를 제공하는 잘못된 Netapp 장치가 있습니다.
동일한 서브넷에 있으므로 이론적으로는 라우팅이 필요하지 않습니다.
문제:때때로 우리는 Linux 상자에서 netapp의 LIF에 접근할 수 있지만 때로는 접근할 수 없습니다(tcpdump에 따르면 응답하지 않습니다).
질문:무엇이 그러한 문제를 일으킬 수 있습니까?
업데이트#1: 다음을 사용하여 언제 좋은지, 나쁜지에 대한 통계를 생성했습니다.
while true; do (nc -w 1 -z IPADDRESSHERE 22 && printf "good\t") || printf "bad\t"; date; sleep 1; done > testing.txt
따라서 매초마다 netcat은 Linux 상자에서 Netapp으로 연결을 시도합니다.
# grep -w bad testing.txt | wc -l; grep -w good testing.txt | wc -l
520
480
#
1000번 시도했을 때 SSH를 520번 얻었고 480번은 시간 초과되었으므로 약 52% 양호, 약 48% 불량입니다. 아마도 50~50% 정도? 장애 조치(failover)와 유사한 문제가 있을 수 있나요?
업데이트#2: 또 다른 흥미로운 점은 잘못된 Netapp은 ping할 수 없지만 다른 모든 Netapp은 ping할 수 있다는 것입니다.