데비안에서 네트워크 연결 끊김 진단은 어디서부터 시작해야 합니까?

Question

귀하는 VPS 호스트에 액세스할 수 없으며 VM 내부에서만 디버깅할 수 있다고 가정합니다. 그래서 이것이 제가 할 일입니다.

VM과 호스트 사이인지, VM과 게이트웨이 사이인지, 아니면 공급자 네트워크 내의 어딘가에서 손상이 발생하는지 알아내려고 합니다.

첫 번째 홉(예: 게이트웨이)을 핑하는 스크립트를 설정하십시오. 동일한 브로드캐스트 도메인 내에 다른 VM이 있는 경우 GW 대신 해당 VM을 ping할 수 있습니다. screen/tmux를 실행하고 내부에 ping을 남겨둘 수 있습니다.

$ ping IP_OF_GW_OR_OTHER_VM | tee -a mytest.log

가동 중단이 발생했을 때 게이트웨이가 아직 살아 있고 핑이 통과한다면 문제가 있는 것입니다. 이 경우 중단이 발생한 위치를 파악할 때까지 추적 경로를 수행하고 다음 2~3개 홉을 핑합니다. 게이트웨이를 즉시 사용할 수 없는 경우 중단이 발생할 때 네트워크 정보의 스냅샷을 찍을 크론을 설정할 수 있습니다.

ping -c 3 gateway
if [ $? -ne 0 ]; then
   ifconfig eth0 2>&1 >> /tmp/ifconfig-$(date +"%Y-%m-%d_%H:%M").log
   ethtool eth0 >> /tmp/ethtool-$(date +"%Y-%m-%d_%H:%M").log
fi

해당 정보가 필요하다고 생각되면 가동 시간(현재 로드를 가져오기 위해) lsof 또는 netstat와 같은 추가 정보로 스크립트를 확장할 수 있습니다.

때로는 게스트 dhclient가 연결을 끊거나 임대 갱신에 실패하므로 중단 시 수집된 모든 정보가 도움이 될 수 있습니다.

Answer 1