No mês passado, notei que nossoDell PowerEdge T630(Ubuntu 14.04.3LTS) o servidor está reiniciando inesperadamente (29 de janeiro foram reinicializações manuais):
$cat /var/log/wtmp.report | grep boot | grep -v 'Jan 29'
reboot system boot 3.13.0-77-generi Wed Feb 10 09:00 - 13:59 (04:58)
reboot system boot 3.13.0-76-generi Wed Jan 27 09:01 - 10:47 (2+01:45)
reboot system boot 3.13.0-74-generi Tue Jan 19 10:34 - 10:47 (10+00:13)
reboot system boot 3.13.0-74-generi Wed Jan 13 09:02 - 10:47 (16+01:45)
Então, de todas as reinicializações não especificadas, todas elas (com exceção de 19 de janeiro) parecem ocorrer todas as quartas-feiras alternadas por volta das 9h (UTC-6).
Examinei todos os suspeitos do costume ( /var/log/kern.log
, /var/log/auth.log
, /var/log/dmesg
, /var/log/syslog
, etc), mas não consigo encontrar nenhum tipo de motivo para a reinicialização.
Estou correndoFail2banno servidor; sempre que faço uma reinicialização manual, recebo um e-mail automático do Fail2ban informando que o SSH foi interrompido e, em seguida, outro e-mail informando que o backup foi reiniciado. Curiosamente, quando ocorrem essas reinicializações não especificadas, recebo apenas um e-mail informando que o SSH foi reiniciado (ou seja, não recebo nenhum sobre o encerramento do SSH).
Alguém tem alguma idéia sobre o que poderia estar causando isso? Este servidor é usado apenas por nós e certamente não está sendo levado ao limite de nenhuma forma. O servidor está executando um sistema tradicional (Apache) Pilha LAMP, junto com SSH e várias outras coisas como python e outros.
Responder1
Descobri que era um problema de energia associado ao nosso prédio. A fonte de alimentação à qual o saque estava conectado estava com defeito e não estava funcionando corretamente quando o prédio passava por oscilações de energia semestrais. De qualquer forma, comprar uma nova fonte de alimentação resolveu o problema.