先月、私たちのデルパワーエッジT630(Ubuntu 14.04.3 LTS) サーバーが予期せず再起動しています (1 月 29 日は手動で再起動しました):
$cat /var/log/wtmp.report | grep boot | grep -v 'Jan 29'
reboot system boot 3.13.0-77-generi Wed Feb 10 09:00 - 13:59 (04:58)
reboot system boot 3.13.0-76-generi Wed Jan 27 09:01 - 10:47 (2+01:45)
reboot system boot 3.13.0-74-generi Tue Jan 19 10:34 - 10:47 (10+00:13)
reboot system boot 3.13.0-74-generi Wed Jan 13 09:02 - 10:47 (16+01:45)
つまり、すべての未指定の再起動のうち、それらはすべて(1月19日を除く) は、隔週水曜日の午前 9 時頃 (UTC-6) に開催されるようです。
いつもの容疑者( /var/log/kern.log
、、、など)をすべて調べましたが、再起動の理由が見つかりません。/var/log/auth.log
/var/log/dmesg
/var/log/syslog
走っていますフェイル2バンサーバー上で、手動で再起動するたびに、Fail2ban から SSH が停止したという自動メールが届き、その後、再起動したという別のメールが届きます。興味深いことに、これらの不特定の再起動が発生すると、SSH が再起動したというメールのみが届きます (つまり、SSH がシャットダウンしたというメールは届きません)。
何が原因なのか、誰か考えがあるでしょうか? このサーバーは私たちだけが使用しており、いかなる能力においても限界まで押し上げられているわけではありません。サーバーは従来の (アパッチ) LAMP スタック、SSH、Python などのさまざまなものなど。
答え1
これは私たちの建物に関連する電源の問題であることがわかりました。サーバーが接続されていた PSU に欠陥があり、建物が 2 週間に 1 度電源がちらつくときに正常に動作していませんでした。とにかく、新しい PSU を購入することで問題は解決しました。