¿Por dónde empezar con el diagnóstico de pérdida de conectividad de red en Debian?

Question

Supongo que no tiene acceso a su host VPS y que solo puede depurar desde dentro de la VM. Entonces esto es lo que yo haría.

Intentaría averiguar dónde ocurre la falla: si es entre la VM y el host, la VM y la puerta de enlace o tal vez en algún lugar dentro de la red de sus proveedores.

Establezca un script que haga ping a su primer salto, es decir, a su puerta de enlace. Si tiene otras máquinas virtuales dentro del mismo dominio de transmisión, puede hacerles ping en lugar de a GW. Podrías ejecutar screen/tmux y dejar ping dentro:

$ ping IP_OF_GW_OR_OTHER_VM | tee -a mytest.log

Cuando ocurre la interrupción, si la puerta de enlace todavía está activa y se realizan pings, tiene un problema que se va al desagüe. En ese caso, haga un traceroute y haga ping en los siguientes 2 o 3 saltos, hasta que averigüe dónde ocurre la interrupción. Si la puerta de enlace no está disponible inmediatamente, entonces tal vez configure un cron que tome una instantánea de la información de la red cuando ocurra la interrupción:

ping -c 3 gateway
if [ $? -ne 0 ]; then
   ifconfig eth0 2>&1 >> /tmp/ifconfig-$(date +"%Y-%m-%d_%H:%M").log
   ethtool eth0 >> /tmp/ethtool-$(date +"%Y-%m-%d_%H:%M").log
fi

Puede ampliar el script con información adicional como tiempo de actividad (para obtener la carga actual) lsof o netstat si cree que también necesita esa información.

A veces, los invitados dhclient cortan la conexión o no renuevan el contrato de arrendamiento, por lo que cualquier información recopilada en el momento de la interrupción puede ayudar.

Answer 1