Bytes em trânsito maiores que a janela do receptor em conexões de cliente congeladas

Bytes em trânsito maiores que a janela do receptor em conexões de cliente congeladas

Estou lidando com uma espécie de "problema fantasma". Temos um URL de endpoint que algumas pessoas podem usar o tempo todo sem problemas, mas outras têm uma conexão congelada no lado do cliente (verificada com vários códigos de cliente escritos em Java, Python C#) que nunca termina enquanto o servidor pode ver a conexão redefinida. Capturei o tráfego pela rede que funciona e está perfeitamente sincronizado e posso ver que quando o remetente se aproxima do tamanho da janela do receptor, ele recua enquanto a rede que falha, os bytes em vôo passam de 3 a 4x acima do tamanho da janela calculado. Para tornar as coisas mais confusas, temos 2 endpoints diferentes com configuração quase idêntica e há um que causa o problema descrito e outro que pode lidar com tudo. (A única diferença entre os endpoints é o tipo de VM usado no cluster). Parece que o escalonamento automático é anunciado em ambos os casos e os pacotes iniciais parecem idênticos para mim. Aqui está uma captura da rede em funcionamento A falha na captura de rede A falha na captura de rede

informação relacionada