За последний месяц я заметил, что нашиDell PowerEdge T630(Ubuntu 14.04.3 LTS) сервер неожиданно перезагружается (29 января были ручные перезагрузки):
$cat /var/log/wtmp.report | grep boot | grep -v 'Jan 29'
reboot system boot 3.13.0-77-generi Wed Feb 10 09:00 - 13:59 (04:58)
reboot system boot 3.13.0-76-generi Wed Jan 27 09:01 - 10:47 (2+01:45)
reboot system boot 3.13.0-74-generi Tue Jan 19 10:34 - 10:47 (10+00:13)
reboot system boot 3.13.0-74-generi Wed Jan 13 09:02 - 10:47 (16+01:45)
Итак, из всех неуказанных перезагрузок, они все (за исключением 19 января) по всей видимости, происходят каждую вторую среду около 9:00 утра (UTC-6).
Я просмотрел все обычные подозреваемые ( /var/log/kern.log
, /var/log/auth.log
, /var/log/dmesg
, /var/log/syslog
, и т.д.), но не могу найти никакой причины для перезагрузки.
я бегуFail2banна сервере; всякий раз, когда я делаю ручную перезагрузку, я получаю автоматическое письмо от Fail2ban, сообщающее, что SSH остановлен, а затем еще одно письмо о том, что он снова запустился. Интересно, что когда происходят эти неуказанные перезагрузки, я получаю только письмо о том, что SSH снова запустился (то есть я не получаю ни одного о том, что SSH отключился).
Есть ли у кого-нибудь идеи, что может быть причиной этого? Этот сервер используется только нами, и, конечно, не доводится до предела в каком-либо качестве. Сервер работает под управлением традиционной (Апачи) Стек LAMP, а также SSH и множество других вещей, таких как Python и т. д.
решение1
Я обнаружил, что проблема была связана с электропитанием нашего здания. Блок питания, к которому был подключен серв, был неисправен и не работал должным образом, когда в здании случались полунедельные перебои с электропитанием. В любом случае, покупка нового блока питания решила проблему.