
Después de volar de un país a otro, ahora no puedo conectarme a varios de mis servidores Digital Ocean Ubuntu. Sin embargo, todavía puedo iniciar sesión a través de la consola y ssh de un cuadro a otro (todos están en el mismo centro de datos físico).
Al ejecutar ssh con -vvvv y ejecutar el comando time con él, el último mensaje de depuración es:
debug2: channel 0: open confirm rwindow 0 rmax 32768
Write failed: Broken pipe
El tiempo de espera se agota después de 1 minuto 37 segundos.
Aquí está el registro de depuración desde el punto en el que la autenticación de clave ssh se realiza correctamente:
debug1: Authentication succeeded (publickey).
Authenticated to 128.199.170.168 ([128.199.170.168]:22).
debug1: channel 0: new [client-session]
debug3: ssh_session2_open: channel_new: 0
debug2: channel 0: send open
debug1: Requesting [email protected]
debug1: Entering interactive session.
debug2: callback start
debug2: fd 3 setting TCP_NODELAY
debug3: packet_set_tos: set IP_TOS 0x10
debug2: client_session2_setup: id 0
debug2: channel 0: request pty-req confirm 1
debug1: Sending environment.
debug3: Ignored env TERM_PROGRAM
debug3: Ignored env SHELL
debug3: Ignored env TERM
debug3: Ignored env TMPDIR
debug3: Ignored env Apple_PubSub_Socket_Render
debug3: Ignored env TERM_PROGRAM_VERSION
debug3: Ignored env TERM_SESSION_ID
debug3: Ignored env USER
debug3: Ignored env SSH_AUTH_SOCK
debug3: Ignored env __CF_USER_TEXT_ENCODING
debug3: Ignored env PATH
debug3: Ignored env MARKPATH
debug3: Ignored env PWD
debug1: Sending env LANG = en_US.UTF-8
debug2: channel 0: request env confirm 0
debug3: Ignored env XPC_FLAGS
debug3: Ignored env PS1
debug3: Ignored env XPC_SERVICE_NAME
debug3: Ignored env SHLVL
debug3: Ignored env HOME
debug3: Ignored env GREP_OPTIONS
debug3: Ignored env LOGNAME
debug3: Ignored env SCALA_HOME
debug3: Ignored env SECURITYSESSIONID
debug3: Ignored env _
debug2: channel 0: request shell confirm 1
debug2: callback done
debug2: channel 0: open confirm rwindow 0 rmax 32768
Write failed: Broken pipe
La conexión no es particularmente lenta, mi shell es bash (y todavía puedo iniciar sesión a través de la consola y otra red ssh). Nada parece estar bloqueando la conexión ssh ya que veo que se está realizando la autenticación de clave pública.
No sé en qué tubería se está escribiendo que está rota. FWIW Me estoy conectando desde OSX pero no tuve problemas hasta volar a EE. UU.
Esto es lo que auth.log
se muestra al intentar iniciar sesión:
May 17 12:28:01 db1 CRON[24931]: pam_unix(cron:session): session opened for user root by (uid=0)
May 17 12:28:01 db1 CRON[24931]: pam_unix(cron:session): session closed for user root
May 17 12:28:02 db1 sshd[24955]: error: Could not load host key: /etc/ssh/ssh_host_ed25519_key
May 17 12:28:04 db1 sshd[24955]: Accepted publickey for tomo from 24.210.28.151 port 63202 ssh2: DSA 3a:[redacted]
May 17 12:28:04 db1 sshd[24955]: pam_unix(sshd:session): session opened for user tomo by (uid=0)
Captura de Tcpdump del tráfico del puerto 22 durante un intento de conexión:
$ sudo tcpdump -i en0 port 22
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on en0, link-type EN10MB (Ethernet), capture size 65535 bytes
19:00:40.917870 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [S], seq 3430788632, win 65535, options [mss 1460,nop,wscale 5,nop,nop,TS val 1286503697 ecr 0,sackOK,eol], length 0
19:00:41.211348 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [S.], seq 4135716624, ack 3430788633, win 28960, options [mss 1460,sackOK,TS val 898678531 ecr 1286503697,nop,wscale 8], length 0
19:00:41.211415 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 1, win 4117, options [nop,nop,TS val 1286503989 ecr 898678531], length 0
19:00:41.215051 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1:22, ack 1, win 4117, options [nop,nop,TS val 1286503992 ecr 898678531], length 21
19:00:41.484824 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [.], ack 22, win 114, options [nop,nop,TS val 898678606 ecr 1286503992], length 0
19:00:41.488532 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 1:42, ack 22, win 114, options [nop,nop,TS val 898678609 ecr 1286503992], length 41
19:00:41.488616 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 42, win 4116, options [nop,nop,TS val 1286504260 ecr 898678609], length 0
19:00:41.490182 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], seq 22:1470, ack 42, win 4116, options [nop,nop,TS val 1286504261 ecr 898678609], length 1448
19:00:41.490183 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1470:1614, ack 42, win 4116, options [nop,nop,TS val 1286504261 ecr 898678609], length 144
19:00:41.491254 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [.], seq 42:1490, ack 22, win 114, options [nop,nop,TS val 898678609 ecr 1286503992], length 1448
19:00:41.592287 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 1490, win 4096, options [nop,nop,TS val 1286504362 ecr 898678609], length 0
19:00:41.760341 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 1490:1674, ack 22, win 114, options [nop,nop,TS val 898678676 ecr 1286504260], length 184
19:00:41.760401 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 1674, win 4090, options [nop,nop,TS val 1286504527 ecr 898678676], length 0
19:00:41.762375 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [.], ack 1614, win 136, options [nop,nop,TS val 898678676 ecr 1286504261], length 0
19:00:41.762409 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1614:1638, ack 1674, win 4096, options [nop,nop,TS val 1286504529 ecr 898678676], length 24
19:00:42.027042 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 1674:1826, ack 1638, win 136, options [nop,nop,TS val 898678743 ecr 1286504529], length 152
19:00:42.027103 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 1826, win 4091, options [nop,nop,TS val 1286504789 ecr 898678743], length 0
19:00:42.028104 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1638:1782, ack 1826, win 4096, options [nop,nop,TS val 1286504790 ecr 898678743], length 144
19:00:42.300304 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 1826:2546, ack 1782, win 148, options [nop,nop,TS val 898678812 ecr 1286504790], length 720
19:00:42.300357 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 2546, win 4073, options [nop,nop,TS val 1286505053 ecr 898678812], length 0
19:00:42.302441 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1782:1798, ack 2546, win 4096, options [nop,nop,TS val 1286505055 ecr 898678812], length 16
19:00:42.600776 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [.], ack 1798, win 148, options [nop,nop,TS val 898678888 ecr 1286505055], length 0
19:00:42.600843 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1798:1850, ack 2546, win 4096, options [nop,nop,TS val 1286505349 ecr 898678888], length 52
19:00:42.857852 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [.], ack 1850, win 148, options [nop,nop,TS val 898678952 ecr 1286505349], length 0
19:00:42.858552 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 2546:2598, ack 1850, win 148, options [nop,nop,TS val 898678952 ecr 1286505349], length 52
19:00:42.858584 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 2598, win 4094, options [nop,nop,TS val 1286505604 ecr 898678952], length 0
19:00:42.859131 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1850:1918, ack 2598, win 4096, options [nop,nop,TS val 1286505605 ecr 898678952], length 68
19:00:43.124310 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 2598:2650, ack 1918, win 148, options [nop,nop,TS val 898679019 ecr 1286505605], length 52
19:00:43.124374 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 2650, win 4094, options [nop,nop,TS val 1286505867 ecr 898679019], length 0
19:00:43.124473 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 1918:2434, ack 2650, win 4096, options [nop,nop,TS val 1286505867 ecr 898679019], length 516
19:00:43.394690 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 2650:2702, ack 2434, win 159, options [nop,nop,TS val 898679086 ecr 1286505867], length 52
19:00:43.394774 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 2702, win 4094, options [nop,nop,TS val 1286506134 ecr 898679086], length 0
19:01:04.685580 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2434:2582, ack 2702, win 4096, options [nop,nop,TS val 1286527239 ecr 898679086], length 148
19:01:04.966270 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 2702:2738, ack 2582, win 170, options [nop,nop,TS val 898684479 ecr 1286527239], length 36
19:01:04.966378 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 2738, win 4094, options [nop,nop,TS val 1286527514 ecr 898684479], length 0
19:01:04.967018 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2582:2702, ack 2738, win 4096, options [nop,nop,TS val 1286527514 ecr 898684479], length 120
19:01:05.269214 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [.], ack 2702, win 170, options [nop,nop,TS val 898684555 ecr 1286527514], length 0
19:01:06.027067 IP [redacted_ip].ssh > 192.168.1.2.50409: Flags [P.], seq 2738:2790, ack 2702, win 170, options [nop,nop,TS val 898684744 ecr 1286527514], length 52
19:01:06.027144 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [.], ack 2790, win 4094, options [nop,nop,TS val 1286528563 ecr 898684744], length 0
19:01:06.027497 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286528563 ecr 898684744], length 460
19:01:06.603432 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286529135 ecr 898684744], length 460
19:01:07.552730 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286530077 ecr 898684744], length 460
19:01:09.250116 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286531762 ecr 898684744], length 460
19:01:12.442790 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286534930 ecr 898684744], length 460
19:01:18.634929 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286541067 ecr 898684744], length 460
19:01:24.068621 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286546451 ecr 898684744], length 460
19:01:34.714519 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286557019 ecr 898684744], length 460
19:01:45.384050 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286567587 ecr 898684744], length 460
19:01:56.051835 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286578155 ecr 898684744], length 460
19:02:06.715163 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286588723 ecr 898684744], length 460
19:02:17.355823 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286599291 ecr 898684744], length 460
19:02:28.042962 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [P.], seq 2702:3162, ack 2790, win 4096, options [nop,nop,TS val 1286609859 ecr 898684744], length 460
19:02:38.690971 IP 192.168.1.2.50409 > [redacted_ip].ssh: Flags [R.], seq 3162, ack 2790, win 4096, length 0
Algunas otras cosas que he probado:
- reducir mtu en el servidor, podría haber una falla en pmtu: sudo ip link set mtu 1280 dev eth0
- reduciendo mtu a 1280 en OS X para mi interfaz wifi
- reduciendo ServerAliveInterval aún más bajo, a 30, donde la conexión aún se agota pero no con una tubería rota
- ejecutando ssh con "cat" en lugar de "bash" o bash pero sin perfil/rc cargado
- configurar la dirección IP de la interfaz wifi de OS X manualmente en lugar de dhcp
Respuesta1
En el seguimiento de paquetes vemos que los paquetes de tamaño máximo se intercambian en ambas direcciones al principio del flujo. Eso no causó ningún problema, por lo que no hay nada que sugiera un problema de MTU.
Más adelante, durante la conexión, vemos que un paquete del cliente al servidor con números de secuencia relativos 2702:3162 nunca recibe un ACK del servidor.
Mi pensamiento inmediato es que esta pérdida de paquetes se debe a un middlebox defectuoso (es decir, NAT, firewall o similar).
He oído hablar de cajas NAT que no pueden manejar cambios de TOS durante una conexión TCP. El problema en su caso ocurre después de que el cliente indica que se han modificado los TOS. Sin embargo, dado que tcpdump no muestra los TOS, no puedo decir con certeza si ese es el punto exacto donde ocurre el problema.
Para una prueba, puede intentar utilizar -o ProxyCommand='nc %h %p'
tal que el cliente ssh no controle directamente la conexión TCP. También puedes probar la IPQoS
opción. Si el problema es el cambio de TOS, entonces especificar -o IPQoS=cs0
o -o IPQoS=0
debería funcionar, pero cualquier otra configuración fallaría. Esto se debe a que ssh utiliza 0 como QoS durante la autenticación y luego cambia a la QoS elegida después de la autenticación. Al elegir QoS como 0, no habrá ningún cambio en el valor de QoS que confunda los cuadros intermedios.
Respuesta2
En caso de que alguien más se encuentre con esto, tuve un problema similar con un enrutador/módem TP-Link Archer VR2600 (con firmware 1.4.0 0.8.0 v0050.0 Build 160518 Rel.50944n
).
Ejecutar con -o IPQoS=0
, como lo sugirió @kasperd, funcionó sugiriendo algún tipo de problema de QoS con mi enrutador. Habilité lo más parecido que pude encontrar en la configuración del enrutador (Avanzado→Control de Ancho de Bandaconfigurando el ancho de banda máximo justo debajo de lo que está disponible en mi línea) bajo el supuesto de que el enrutador podría comenzar a prestar atención a las banderas relevantes en este caso.
Esto pareció funcionar y mis conexiones ahora se están comunicando. Alternar esta opción controla de manera confiable si puedo comunicarme.
Respuesta3
¿Tiene una configuración ssh de usuario (~/.ssh/config)?
Si no, cree uno e intente agregarle las siguientes líneas:
ServerAliveInterval 120 #ping the server every 120s
TCPKeepAlive no #do not set SO_KEEPALIVE on socket
Respuesta4
Lamentablemente, no tengo suficiente reputación aquí para votar o comentar sobre la respuesta anterior de Sam Mason, pero me gustaría hacer +1 públicamente en lo que dijo. También tengo un VR2600 y también tuve la misma experiencia:
- Se establece la conexión (ssh, sftp, etc.) pero luego parece colgarse
- tshark muestra retransmisiones espurias de TCP
- configurar -o IPQoS=0 (por sí solo) desde el lado del cliente no hizo nada
- habilitandola configuración Avanzado->Control de ancho de banda en el enrutador (previamente deshabilitada), con los límites más altos posibles (= efectivamente ilimitado), parece arreglar el enrutador de manera que preste atención al indicador IPQoS
- tshark ya no muestra retransmisiones espurias TCP y la conexión ya no se bloquea (los clientes ssh, sftp, etc. ahora funcionan con un servidor detrás del enrutador VR2600).
Parece sugerir un error importante en el enrutador VR2600. Desafortunadamente (en el momento de escribir este artículo), tengo el firmware más reciente (1.4.0 0.8.0 v0050.0 Build 160518 Rel.50944n, igual que Sam), y este enrutador no parece ser compatible ni probado con DD-WRT. .
SIN EMBARGO, para agregar a lo discutido anteriormente, también diré:
- Habiendo realizado los pasos 1 al 5, ahora puedo conectarme exitosamente incluso sin especificar "-o IPQoS=0"
En otras palabras:
Simplemente activar la opción Avanzado->Control de ancho de banda en las opciones del enrutador (incluso con un límite superior máximo) parece ser suficiente para que la NAT de este enrutador se comporte como se esperaba. Si el control de ancho de banda está deshabilitado, se produce el problema descrito en el OP (y con gran detalle por @malasa).
No está claro si la solución es simplemente habilitar esta opción o si también necesita conectarse al menos una vez con la opción -o. En cualquier caso, puedo confirmar que, después de haber habilitado esta opción, si luegodesactivaresa opción Avanzado->Control de ancho de banda, entonces mis ssh/sftp/etc están rotos como antes. Si yopermitiresa opción Avanzado->Control de ancho de banda, todo parece funcionar como se esperaba nuevamente. Y (habiendo habilitado esta opción) todo parece funcionar bien también al reiniciar el enrutador.
Por lo tanto, es una solución alternativa bastante buena que no requiere cambios ni mantenimiento del lado del cliente, desde mi punto de vista (para responder a la preocupación de @leonardoborges)