
Наш вычислительный движок, который управляет серверной частью мобильной игры, сегодня (03.08.18) внезапно отключился, и журналы не позволяют определить, какой пользователь или IP-адрес инициировал это.
Я немного покопался и добрался до Syslogs, которые отображают следующее:
Mar 8 10:58:10 redis-prod-vm systemd[1]: Started Synchronise Hardware Clock to System Clock.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Session 5 of user redis.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping User Manager for UID 999...
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopping Default.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Graphical Interface.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopped target Graphical Interface.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Entropy daemon using the HAVEGE algorithm...
Mar 8 10:58:10 redis-prod-vm haveged[369]: haveged: Stopping due to signal 15
Mar 8 10:58:10 redis-prod-vm haveged[369]: haveged starting up
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Multi-User System.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopped target Multi-User System.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Default.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopping Basic System.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Basic System.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopping Paths.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Paths.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopping Timers.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Timers.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopping Sockets.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Stopped target Sockets.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Starting Shutdown.
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Reached target Shutdown.
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Deferred execution scheduler...
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping vsftpd FTP server...
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping LSB: bitnami init script...
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Regular background program processing daemon...
Mar 8 10:58:10 redis-prod-vm systemd[7558]: Starting Exit the Session...
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping Google Compute Engine user shutdown scripts...
Mar 8 10:58:10 redis-prod-vm systemd[1]: Stopping OpenBSD Secure Shell server...
Это продолжалось до тех пор, пока виртуальная машина не завершила работу. Вот журнал:
2018-03-08 10:59:46.073 GMT compute.instances.stop {
"event_timestamp_us":"XXX",
"actor":{"user":""},
"resource":{
"name":"redis-prod-vm",
"type":"instance",
"zone":"us-central1-f","id":"XXX"
},
"event_type":"GCE_OPERATION_DONE",
"trace_id":"XXX",
"operation":{"type":"operation",…
Я заменил некоторые потенциально важные цифры на XXX, чтобы быть в безопасности. Может кто-нибудь помочь пролить свет на то, что произошло?
решение1
Я публикую этот ответ, чтобы дать рекомендацию, предоставленную@Тахерв разделе комментариев более заметно:
Пожалуйста, ознакомьтесь с документацией.Вытесняемые экземпляры ВМ:
Вытесняемая виртуальная машина — это экземпляр, который вы можете создать и запустить по гораздо более низкой цене, чем обычные экземпляры. Однако,Compute Engine может остановить (вытеснить) эти экземпляры, если ему требуется доступ к этим ресурсам для других задач.Вытесняемые экземпляры представляют собой избыточную емкость Compute Engine, поэтому их доступность зависит от использования.
Если ваши приложения отказоустойчивы и могут выдерживать возможные прерывания экземпляров, то прерываемые экземпляры могут значительно снизить ваши затраты на Compute Engine. Например, задания пакетной обработки могут выполняться на прерываемых экземплярах. Если некоторые из этих экземпляров останавливаются во время обработки, задание замедляется, но не останавливается полностью. Прерываемые экземпляры выполняют ваши задачи пакетной обработки, не создавая дополнительной рабочей нагрузки на ваши существующие экземпляры и не требуя от вас полной оплаты за дополнительные обычные экземпляры.
Проверьте, является ли ваш экземпляр вытесняемым или нет.
Также вы можете следить за документациейПросмотр вывода последовательного портаи проверьте, есть ли какая-либо полезная информация в журнале.
Кроме того, пожалуйста, рассмотрите возможность использованияИспользование обозревателя журналовдля сбора дополнительной информации по устранению неполадок.