С чего начать диагностику разрыва сетевого подключения в Debian?

Question

Я предполагаю, что у вас нет доступа к вашему VPS-хосту, и что вы можете отлаживать только изнутри VM. Так что вот что я бы сделал.

Я бы попытался выяснить, где произошел сбой — между виртуальной машиной и хостом, виртуальной машиной и шлюзом или, может быть, где-то в сети вашего провайдера.

Установите скрипт, который будет пинговать ваш первый хоп - т.е. ваш шлюз. Если у вас есть другие виртуальные машины в том же широковещательном домене, вы можете пинговать их вместо GW. Вы можете запустить screen/tmux и оставить ping внутри:

$ ping IP_OF_GW_OR_OTHER_VM | tee -a mytest.log

Если при сбое шлюз все еще работает и пинги проходят, значит, проблема в трубе. В этом случае выполните traceroute и ping следующих 2-3 переходов, пока не выясните, где произошел сбой. Если шлюз сразу же становится недоступным, то, возможно, стоит настроить cron, который сделает снимок сетевой информации при сбое:

ping -c 3 gateway
if [ $? -ne 0 ]; then
   ifconfig eth0 2>&1 >> /tmp/ifconfig-$(date +"%Y-%m-%d_%H:%M").log
   ethtool eth0 >> /tmp/ethtool-$(date +"%Y-%m-%d_%H:%M").log
fi

Вы можете расширить скрипт, добавив в него дополнительную информацию, например время безотказной работы (чтобы получить текущую нагрузку), lsof или netstat, если считаете, что эта информация вам тоже нужна.

иногда гостевой dhclient теряет соединение или не может продлить аренду, поэтому любая информация, собранная во время сбоя, может помочь.

Answer 1