
Partindo da pergunta anterior, onde recebi excelentes conselhos do LinuxDevOps, que optei parcialmente por ignorar; o pior aconteceu e não sei por que nem como investigar a causa.
Eu tenho um servidor dedicado rodando Ubuntu Server 13.10.
Eu tive algumas atualizações do kernel que exigiam uma reinicialização, então deixei uma semana e, às 2 da manhã de sábado, reiniciei usando sudo reboot -r now. O servidor não voltou a funcionar. Não consegui mais me conectar via SSH, nem obter uma conexão com o Apache via HTTP.
Tive que fazer com que o datacenter viesse em socorro, pois estava trancado do lado de fora. O que eles fizeram foi que simplesmente reiniciaram o servidor e tudo estava bem, então eu estava online novamente.
Então, agora, aprendi da maneira mais difícil, e o LinuxDevOps estava certo ao colocar o ponto número 1 em negrito em sua resposta. Tomei isso como uma precaução improvável de poder pular...
Como posso investigar o que deu errado?
No momento, não posso reiniciar o servidor novamente, pois não tenho nada que sugira que isso não será repetido.
Obrigado.
Apr 6 02:20:24 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr 6 02:20:34 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr 6 03:38:13 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr 6 03:38:13 kernel: [ 0.000000] Initializing cgroup subsys cpuset
Apr 6 03:38:13 kernel: [ 0.000000] Initializing cgroup subsys cpu
Apr 6 03:38:13 kernel: [ 0.000000] Initializing cgroup subsys cpuacct
etc... normal startup
Então, isso mostra que as duas primeiras entradas parecem uma tentativa de inicializar em um ponto específico e, uma hora depois, quando o datacenter o reinicializou, uma inicialização normal. Isto é de /var/log/kern.log.
Obrigado.
Responder1
Praticamente a única coisa que você pode fazer agora é consultar seus registros em busca de informações que possam estar relacionadas aos problemas que você teve. É isso.