Desligamento aleatório do Google Compute Engine

Desligamento aleatório do Google Compute Engine

Nosso Compute Engine, que executa o back-end de um jogo para dispositivos móveis, foi desligado aleatoriamente hoje (03/08/18) e os registros não conseguem me dizer qual usuário ou endereço IP o iniciou.

Estive pesquisando e entrei nos Syslogs, que exibem o seguinte:

Mar  8 10:58:10 redis-prod-vm systemd[1]: Started Synchronise Hardware Clock to System Clock.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Session 5 of user redis.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping User Manager for UID 999...
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Default.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Graphical Interface.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopped target Graphical Interface.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Entropy daemon using the HAVEGE algorithm...
Mar  8 10:58:10 redis-prod-vm haveged[369]: haveged: Stopping due to signal 15
Mar  8 10:58:10 redis-prod-vm haveged[369]: haveged starting up
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Multi-User System.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopped target Multi-User System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Default.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Basic System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Basic System.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Paths.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Paths.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Timers.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Timers.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopping Sockets.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Sockets.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Starting Shutdown.
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Reached target Shutdown.
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Deferred execution scheduler...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping vsftpd FTP server...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping LSB: bitnami init script...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Regular background program processing daemon...
Mar  8 10:58:10 redis-prod-vm systemd[7558]: Starting Exit the Session...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping Google Compute Engine user shutdown scripts...
Mar  8 10:58:10 redis-prod-vm systemd[1]: Stopping OpenBSD Secure Shell server...

Isso continuou até a VM terminar de desligar. Aqui está o log:

2018-03-08 10:59:46.073 GMT compute.instances.stop {
    "event_timestamp_us":"XXX",
    "actor":{"user":""},
    "resource":{
        "name":"redis-prod-vm",
        "type":"instance",
        "zone":"us-central1-f","id":"XXX"
    },
    "event_type":"GCE_OPERATION_DONE",
    "trace_id":"XXX",
    "operation":{"type":"operation",…

Substituí alguns números potencialmente importantes por XXX por segurança. Alguém pode ajudar a esclarecer o que aconteceu?

Responder1

Eu posto esta resposta para fazer recomendações fornecidas por@Taherna seção de comentários mais visível:

Por favor, dê uma olhada na documentaçãoInstâncias de VM preemptivas:

Uma VM preemptiva é uma instância que você pode criar e executar por um preço muito mais baixo do que as instâncias normais. No entanto,O Compute Engine poderá interromper (preemptar) essas instâncias se exigir acesso a esses recursos para outras tarefas.As instâncias preemptivas são capacidade excessiva do Compute Engine, portanto, a disponibilidade delas varia de acordo com o uso.

Se seus aplicativos forem tolerantes a falhas e puderem suportar possíveis preempções de instância, as instâncias preemptivas poderão reduzir significativamente os custos do Compute Engine. Por exemplo, trabalhos de processamento em lote podem ser executados em instâncias preemptivas. Se algumas dessas instâncias forem interrompidas durante o processamento, a tarefa ficará lenta, mas não será completamente interrompida. As instâncias preemptivas concluem suas tarefas de processamento em lote sem colocar carga de trabalho adicional nas instâncias existentes e sem exigir que você pague o preço total por instâncias normais adicionais.

Verifique se sua instância é preemptiva ou não.

Além disso, você pode seguir a documentaçãoVisualizando a saída da porta seriale verifique se há alguma informação útil de registro.

Além disso, considere usarUsando o Explorador de registrospara coletar mais informações sobre solução de problemas.

informação relacionada