Ubuntu 16.04. Reinicializado sem registros

Ubuntu 16.04. Reinicializado sem registros

Meu servidor que estava ativo desde os últimos 6 meses foi reiniciado hoje. Não foi possível saber o motivo até agora. Verifiquei o seguinte...

  1. a última reinicialização mostra "reboot system boot 4.14.0-generic"
  2. /var/log/syslog - nenhuma entrada de reinicialização/pânico 11h21 - últimos logs de aplicativos (genéricos) 11h23 - logs de inicialização do sistema 11h24 - retomada dos logs de aplicativos
  3. /var/messages - Nenhuma entrada encontrada relacionada à reinicialização naquele momento.
  4. /proc/sys/kernel/panic é 0.
  5. /etc/apt/apt.conf.d/50unattended-upgrades //Atualização não assistida::Reinicialização automática "false";
  6. Console de gerenciamento verificado (do servidor) e nenhuma atividade e alarme de hardware relatados.

o servidor apareceu em um minuto sem nenhum problema, mas estou curioso para saber o motivo.

Por favor, guie-me para chegar ao fundo disso ...

Responder1

Conforme mencionado por Gerald, o Ubuntu 16.04 está desatualizado e deve ser atualizado (ou adquira um novo servidor com 20.04 e desligue o antigo).

Após 6 meses de funcionamento constante, não é improvável uma pequena falha que force uma reinicialização. Existem várias razões para isso, e o que você observou poderia ter lhe dado uma pista, mas quando você não vê absolutamente nada, há duas razões principais pelas quais isso pode acontecer:

  • A energia acabou
  • Falha de hardware que não pôde ser detectada no software e o servidor possui um watchdog permitindo pelo menos desligar (talvez tenha enviado uma mensagem APCI embora isso pudesse ter sido registrado, se o hardware não estiver funcionando corretamente, o software falharia em reportar o emitir)

Se não reinicializou automaticamente, simplesmente travou, o que também indica um problema de hardware e o software nunca teve chance de fazer nada a respeito.

O /proc/sys/kernel/panicarquivo é um sinalizador para informar ao kernel o que fazer em caso de erro detectado pelo kernel (ou seja, no software). Você pode encontrar detalhesaqui. Como você diz que é zero, ele não seria reinicializado automaticamente no software em caso de pânico.

Do meu lado, uma vez tive um problema com um receptor Bluetooth. Ele receberia tantos acessos que, após alguns minutos, criaria um bloqueio no kernel. No entanto, isso não foi relatado claramente nos registros. Esse computador, entretanto, tinha um modo de depuração e eu podia ouvir mensagens na porta USB. Isso me deu as informações de que preciso (toneladas de mensagens sobre Bluetooth). Desligar isso tornou o sistema estável novamente. Como você teve apenas um evento, eu não me preocuparia com isso. Se isso se repetir continuamente, provavelmente é hora de considerar o uso de hardware diferente.

informação relacionada