En el último mes, he notado que nuestroDell PowerEdge T630(Ubuntu 14.04.3 LTS) el servidor se reinicia inesperadamente (el 29 de enero fueron reinicios manuales):
$cat /var/log/wtmp.report | grep boot | grep -v 'Jan 29'
reboot system boot 3.13.0-77-generi Wed Feb 10 09:00 - 13:59 (04:58)
reboot system boot 3.13.0-76-generi Wed Jan 27 09:01 - 10:47 (2+01:45)
reboot system boot 3.13.0-74-generi Tue Jan 19 10:34 - 10:47 (10+00:13)
reboot system boot 3.13.0-74-generi Wed Jan 13 09:02 - 10:47 (16+01:45)
Entonces, de todos los reinicios no especificados, todos (con excepción del 19 de enero) parecen tener lugar cada dos miércoles alrededor de las 9:00 am (UTC-6).
Revisé todos los sospechosos habituales ( ,,,, /var/log/kern.log
etc. ) , pero no puedo encontrar ningún tipo de motivo para el reinicio./var/log/auth.log
/var/log/dmesg
/var/log/syslog
Estoy corriendofalla2banen el servidor; Cada vez que reinicio manualmente, recibo un correo electrónico automatizado de Fail2ban diciendo que SSH se ha detenido, y luego otro correo electrónico diciendo que se ha reiniciado. Curiosamente, cuando ocurren estos reinicios no especificados, solo recibo un correo electrónico que dice que SSH se ha reiniciado (es decir, no recibo ninguno sobre el cierre de SSH).
¿Alguien tiene alguna idea sobre qué podría estar causando esto? Este servidor solo lo utilizamos nosotros y ciertamente no está siendo llevado al límite en ninguna capacidad. El servidor ejecuta un tradicional (apache) Pila LAMP, junto con SSH y varias otras cosas como Python y otras cosas.
Respuesta1
Descubrí que era un problema de energía asociado con nuestro edificio. La fuente de alimentación a la que estaba conectado el servicio estaba defectuosa y no funcionaba correctamente cuando el edificio pasaba por su parpadeo de energía quincenal. De todos modos, comprar una nueva fuente de alimentación resolvió el problema.