Apagado aleatorio de Google Compute Engine

Apagado aleatorio de Google Compute Engine

Nuestro Compute Engine, que ejecuta el backend de un juego móvil, se apagó aleatoriamente hoy (3/8/18) y los registros no pueden decirme qué usuario o dirección IP lo inició.

Estuve investigando un poco y entré en Syslogs, que muestra lo siguiente:

Mar  8 10:58:10 redis-prod-vm systemd[1]: Started Synchronise Hardware Clock to System Clock.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Session 5 of user redis.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping User Manager for UID 999...
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Default.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Graphical Interface.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopped target Graphical Interface.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Entropy daemon using the HAVEGE algorithm...
Mar  8 10:58:10 redis-prod-vm haveged[369]: haveged: Stopping due to signal 15
Mar  8 10:58:10 redis-prod-vm haveged[369]: haveged starting up
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Multi-User System.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopped target Multi-User System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Default.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Basic System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Basic System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Paths.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Paths.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Timers.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Timers.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Sockets.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Sockets.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Starting Shutdown.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Reached target Shutdown.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Deferred execution scheduler...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping vsftpd FTP server...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping LSB: bitnami init script...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Regular background program processing daemon...
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Starting Exit the Session...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Google Compute Engine user shutdown scripts...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping OpenBSD Secure Shell server...

Esto continuó hasta que la VM terminó de apagarse; aquí está el registro:

2018-03-08 10:59:46.073 GMT compute.instances.stop {
    "event_timestamp_us":"XXX",
    "actor":{"user":""},
    "resource":{
        "name":"redis-prod-vm",
        "type":"instance",
        "zone":"us-central1-f","id":"XXX"
    },
    "event_type":"GCE_OPERATION_DONE",
    "trace_id":"XXX",
    "operation":{"type":"operation",…

Reemplacé algunos números potencialmente importantes con XXX para estar seguro. ¿Alguien puede ayudarme a arrojar luz sobre lo sucedido?

Respuesta1

Publico esta respuesta para hacer la recomendación proporcionada por@Taheren la sección de comentarios más visible:

Por favor, eche un vistazo a la documentación.Instancias de VM interrumpibles:

Una VM interrumpible es una instancia que puede crear y ejecutar a un precio mucho más bajo que las instancias normales. Sin embargo,Compute Engine podría detener (adelantar) estas instancias si requiere acceso a esos recursos para otras tareas.Las instancias preferentes son un exceso de capacidad de Compute Engine, por lo que su disponibilidad varía según el uso.

Si sus aplicaciones son tolerantes a fallas y pueden soportar posibles apropiaciones de instancias, las instancias apropiables pueden reducir significativamente sus costos de Compute Engine. Por ejemplo, los trabajos de procesamiento por lotes se pueden ejecutar en instancias interrumpibles. Si algunas de esas instancias se detienen durante el procesamiento, el trabajo se ralentiza pero no se detiene por completo. Las instancias preferentes completan sus tareas de procesamiento por lotes sin imponer una carga de trabajo adicional a sus instancias existentes y sin que usted tenga que pagar el precio completo por instancias normales adicionales.

Verifique si su instancia es preferible o no.

Además, puedes seguir la documentación.Visualización de la salida del puerto seriey compruebe si hay alguna información de registro útil.

Además, considere utilizarUsando el Explorador de registrospara recopilar más información sobre solución de problemas.

información relacionada