¿Qué puede hacer que una conexión de red "falle"?

¿Qué puede hacer que una conexión de red "falle"?

Hay una caja de Linux.

Hay un dispositivo Netapp defectuoso que sirve de almacenamiento.

Están en la misma subred, por lo que, en teoría, no se necesita enrutamiento.

El problema:A veces podemos alcanzar el LIF de netapp, desde la caja de Linux, a veces no (según tcpdump simplemente no responde).

La pregunta:¿Qué podría causar tal problema?

ACTUALIZACIÓN#1: creó estadísticas sobre cuándo es bueno o malo con:

while true; do (nc -w 1 -z IPADDRESSHERE 22 && printf "good\t") || printf "bad\t"; date; sleep 1; done > testing.txt

Entonces, cada segundo, netcat intenta conectarse desde la caja de Linux -> a Netapp.

# grep -w bad testing.txt | wc -l; grep -w good testing.txt | wc -l
520
480
#

Al intentarlo 1000 veces, obtuvimos un SSH 520 veces y 480 veces simplemente se agotó el tiempo de espera, por lo que aproximadamente un 52 % es bueno y un 48 % es malo. ¿Quizás entre un 50 y un 50%? ¿Podría haber algún problema similar a una conmutación por error?

ACTUALIZACIÓN#2: Otra cosa interesante es que no se puede hacer ping a la Netapp defectuosa, mientras que a todas las demás Netapp sí se les puede hacer ping.

información relacionada