Tengo una instancia EC2 que ha estado funcionando durante aproximadamente 1 año.
Siempre hemos podido conectarnos a través de SSH sin problemas hasta ayer, cuando de repente, después de reiniciar, todas mis conexiones fueron rechazadas.
Nunca he realizado ninguna modificación a la configuración de ssh. He configurado el grupo de seguridad EC2 para permitir SSH en el puerto 22 desde 0.0.0.0/0 para garantizar que cambiar las IP no pueda ser un problema.
Cuando intento conectarme con SSH a través de PuTTY:
Error de red: Conexión rechazada.
Cuando intento conectar SSH a través de la consola de AWS:
Hubo un problema al configurar la conexión de la instancia. Se produjo un error y no pudimos conectarnos o permanecer conectados a su instancia. Si esta instancia acaba de iniciarse, inténtelo de nuevo en uno o dos minutos.
Intenté reiniciar, detener, forzar la detención y comenzar de nuevo. El problema persiste en todos los arranques, e incluso cuando el volumen está conectado a una nueva instancia como volumen raíz.
El registro del sistema en la consola de AWS muestra:
No se pudo iniciar el servidor OpenBSD Secure Shell. Consulte 'systemctl status ssh.service' para obtener más detalles.
[[0;1;31mFAILED[0m] Failed to start OpenBSD Secure Shell server. See 'systemctl status ssh.service' for details.
El problema es que no puedo conectarme para ejecutar comandos y verificar el estado de ssh.service.
Cloné el volumen y lo conecté a una nueva instancia como unidad secundaria.
Revisé el archivo sshd.conf en /etc/ssh/sshd_config y no veo ningún daño. También revisé el archivo auth.log y puedo ver mucha actividad CRON, pero nada de SSHD:
Nov 26 10:39:08 ip-172-31-9-### systemd-logind[1163]: Watching system buttons on /dev/input/event0 (Power Button)
Nov 26 10:39:08 ip-172-31-9-### systemd-logind[1163]: Watching system buttons on /dev/input/event1 (Sleep Button)
Nov 26 10:39:08 ip-172-31-9-### systemd-logind[1163]: New seat seat0.
Nov 26 10:40:01 ip-172-31-9-### CRON[2089]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:41:01 ip-172-31-9-### CRON[2774]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:41:03 ip-172-31-9-### CRON[2089]: pam_unix(cron:session): session closed for user ubuntu
Nov 26 10:42:01 ip-172-31-9-### CRON[3410]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:42:02 ip-172-31-9-### CRON[2774]: pam_unix(cron:session): session closed for user ubuntu
Nov 26 10:43:01 ip-172-31-9-### CRON[4042]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:43:02 ip-172-31-9-### CRON[3410]: pam_unix(cron:session): session closed for user ubuntu
Nov 26 10:44:01 ip-172-31-9-### CRON[4660]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:44:02 ip-172-31-9-### CRON[4042]: pam_unix(cron:session): session closed for user ubuntu
Nov 26 10:45:01 ip-172-31-9-### CRON[5290]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:45:01 ip-172-31-9-### CRON[4660]: pam_unix(cron:session): session closed for user ubuntu
Nov 26 10:46:01 ip-172-31-9-### CRON[5912]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Nov 26 10:46:02 ip-172-31-9-### CRON[5290]: pam_unix(cron:session): session closed for user ubuntu
Nov 26 10:46:46 ip-172-31-9-### systemd-logind[1166]: Watching system buttons on /dev/input/event0 (Power Button)
Nov 26 10:46:46 ip-172-31-9-### systemd-logind[1166]: Watching system buttons on /dev/input/event1 (Sleep Button)
Nov 26 10:46:46 ip-172-31-9-### systemd-logind[1166]: New seat seat0.
Nov 26 10:47:01 ip-172-31-9-### CRON[1775]: pam_unix(cron:session): session opened for user ubuntu by (uid=0)
Mirando hacia atrás cuando estaba funcionando, puedo ver líneas como esta:
Nov 26 01:53:50 ip-172-31-14-### sshd[6236]: Accepted publickey for ubuntu from 58.96.###.### port 50753 ssh2: RSA SHA256:#######################
Nov 26 01:53:50 ip-172-31-14-### sshd[6236]: pam_unix(sshd:session): session opened for user ubuntu by (uid=0)
Nov 26 01:53:50 ip-172-31-14-### systemd-logind[1128]: New session 20 of user ubuntu.
Esto es en una instancia de producción. Logré volver a una copia de seguridad y ejecutar una nueva instancia. Esto funciona por ahora, pero realmente necesitamos llegar a la causa raíz de este problema para asegurarnos de que no nos quedemos atascados y no podamos conectarnos nuevamente.
¿Alguna idea de cuál podría ser el problema? ¡Cualquier ayuda sería muy apreciada!