Ubuntuサーバーが勝手に再起動した

Ubuntuサーバーが勝手に再起動した

私は Linode の Ubuntu 16.04.3 LTS ボックスを実行しています。これはあまり使用されていませんが、アップタイム モニターによると、サイトが復旧するまでに 1 時間近くダウンしていたとのことです。確認したところ、サーバーが再起動され、そのときにサイトが回復しました。Linode からメールが届きましたHost initiated restart。Linode 内で設定された高使用率しきい値のアラートも起動しませんでした。

何が起こったのか把握しようとしています。Linode を搭載した別の Ubuntu ボックスで問題が発生したのを確認しました。Linode サポートによると、何かが原因で Linode がクラッシュし、Lassie (ウォッチドッグ) が再起動したとのことでしたが、ここでもまさにそれが起こったようです。

と の両方を確認しましたが/var/log/auth.log、ダウンタイムの期間であるから/var/log/syslogの間のログ エントリが欠落しているようです。特に目立つメッセージはありません。私のサーバーにはログがありません。18:0318:57/var/log/messages

の内容/var/log/syslog

Feb 23 18:03:04 localhost alertyo-engine[6279]: Un-Setting flag
Feb 23 18:03:04 localhost alertyo-engine[6279]: Alloc = 1 MiB#011TotalAlloc = 2470 MiB#011HeapAlloc = 1 MiB#011Sys = 10 MiB#011NumGC = 10856
Feb 23 18:57:14 localhost rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="3304" x-info="http://www.rsyslog.com"] start
Feb 23 18:57:14 localhost rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's groupid changed to 108
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's userid changed to 104
Feb 23 18:57:14 localhost systemd[1]: Mounted FUSE Control File System.

の内容/var/log/auth.log

Feb 23 18:03:01 localhost CRON[29814]: pam_unix(cron:session): session closed for user root
Feb 23 18:03:01 localhost CRON[29813]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:57:14 localhost CRON[3301]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:57:15 localhost systemd-logind[3312]: Watching system buttons on /dev/input/event0 (Power Button)
Feb 23 18:57:15 localhost systemd-logind[3312]: New seat seat0.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on 0.0.0.0 port 22.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on :: port 22.
Feb 23 18:57:16 localhost CRON[3301]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:58:01 localhost CRON[3680]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session closed for user ashfame

他に何を確認すればよいでしょうか? これが繰り返し発生する問題であれば、何が問題なのかを突き止めるために、ログ記録に関する設定をさらに行うことができると思いますが、前回 (別のボックスで発生) と同様に、これは数か月に 1 度発生する現象ではないかと思います。再発に備えるのではなく、何が起こったのかを突き止めるにはどうすればよいでしょうか?

答え1

これは Linode の Fermont データ センターで発生した停電が原因であることがわかりました。

したがって、このような問題に関してサーバー ログに何も表示されない場合、サーバーの電源がオフになっているためにログに何も表示されないことが原因の 1 つと考えられます (ただし、一部のシステムではそうできると読んだ覚えがあります)。

プロバイダーのステータス ページと Twitter 検索を常に確認することをお勧めします :)

関連情報