Hay una caja de Linux.
Hay un dispositivo Netapp defectuoso que sirve de almacenamiento.
Están en la misma subred, por lo que, en teoría, no se necesita enrutamiento.
El problema:A veces podemos alcanzar el LIF de netapp, desde la caja de Linux, a veces no (según tcpdump simplemente no responde).
La pregunta:¿Qué podría causar tal problema?
ACTUALIZACIÓN#1: creó estadísticas sobre cuándo es bueno o malo con:
while true; do (nc -w 1 -z IPADDRESSHERE 22 && printf "good\t") || printf "bad\t"; date; sleep 1; done > testing.txt
Entonces, cada segundo, netcat intenta conectarse desde la caja de Linux -> a Netapp.
# grep -w bad testing.txt | wc -l; grep -w good testing.txt | wc -l
520
480
#
Al intentarlo 1000 veces, obtuvimos un SSH 520 veces y 480 veces simplemente se agotó el tiempo de espera, por lo que aproximadamente un 52 % es bueno y un 48 % es malo. ¿Quizás entre un 50 y un 50%? ¿Podría haber algún problema similar a una conmutación por error?
ACTUALIZACIÓN#2: Otra cosa interesante es que no se puede hacer ping a la Netapp defectuosa, mientras que a todas las demás Netapp sí se les puede hacer ping.