Estou executando um servidor interno bastante simples para hospedar GitLab e MatterMost (alternativa ao bate-papo do Slack). O problema que estou tendo é que 9 em cada 10 vezes, se eu precisar reiniciar o servidor, ele nunca volta sozinho (desliga - a cabeça é apenas uma tela preta na sala do servidor) e eu tenho que entrar no sala do servidor e reinicialize-a. Isso é um problema porque quero que ele seja capaz de reiniciar sem problemas caso eu não esteja no escritório para fazer isso manualmente.
Aqui está uma cópia do meu /var/log/syslog
- sou novo em seguir esses registros e não vejo nenhum sinal de alerta óbvio. Este é mesmo o arquivo de log que eu deveria examinar nesta circunstância?
Responder1
Eu desligaria os serviços, começando pelo IPMI e EDAC, e veria se algum deles era o responsável. Presumo que você esteja atualizado sobre os pacotes. Experimente kernels mais recentes.
Você testou a RAM? É ECC?
Quando você diz 'travar', há atividade no disco? Mais alguma coisa sugestiva de vida?