Diagnóstico de falha do servidor...Existe algum programa estilo 'gravador de caixa preta' disponível

Question 1

este é o horário em que os trabalhos do cron.daily são agendados, então eu procuraria em /etc/cron.daily ou semanalmente ou mensalmente como os primeiros suspeitos

você pode instalar em cima que registrará instantâneos dos processos a cada 10 minutos

alternativamente você pode instalar o psacct e usar accton e lastcomm para ver o que estava sendo executado

ativar a auditoria também é uma opção, consulte auditd(8)

Answer

este é o horário em que os trabalhos do cron.daily são agendados, então eu procuraria em /etc/cron.daily ou semanalmente ou mensalmente como os primeiros suspeitos

você pode instalar em cima que registrará instantâneos dos processos a cada 10 minutos

alternativamente você pode instalar o psacct e usar accton e lastcomm para ver o que estava sendo executado

ativar a auditoria também é uma opção, consulte auditd(8)

Question 2

Você pode habilitar core dumps, que copiarão a memória do sistema para um arquivo quando um servidor travar.

O próximo problema é o que fazer com o arquivo coredump... Se você tem alguém por perto que sabe tudo sobre gdb, ele pode fazer algo a respeito... ou você pode usar o comando "strings" para despejar tudo do texto do arquivo coredump e talvez você consiga encontrar algo.

Answer

Você pode habilitar core dumps, que copiarão a memória do sistema para um arquivo quando um servidor travar.

O próximo problema é o que fazer com o arquivo coredump... Se você tem alguém por perto que sabe tudo sobre gdb, ele pode fazer algo a respeito... ou você pode usar o comando "strings" para despejar tudo do texto do arquivo coredump e talvez você consiga encontrar algo.

Question 3

faça login em uma caixa diferente que esteja bem conectada, execute screen, ssh no servidor e siga kern.log, daemon.log, syslog, mensagens em janelas de tela individuais. (control-A, c para criar uma nova janela, Control-A,D para desanexar, screen -r para continuar)

quando o servidor travar novamente, você deverá ter o final dos logs em sua sessão de tela, mesmo que eles não tenham sido descarregados no disco corretamente quando a máquina travar.

Se você suspeitar de kernel panic ou oops

kernel.panic=5 kernel.panic_on_oops=5

em seu sysctl.conf ou arquivo equivalente aguardará 5 segundos, possivelmente permitindo que as unidades sejam descarregadas, e então será reinicializado.

Answer

faça login em uma caixa diferente que esteja bem conectada, execute screen, ssh no servidor e siga kern.log, daemon.log, syslog, mensagens em janelas de tela individuais. (control-A, c para criar uma nova janela, Control-A,D para desanexar, screen -r para continuar)

quando o servidor travar novamente, você deverá ter o final dos logs em sua sessão de tela, mesmo que eles não tenham sido descarregados no disco corretamente quando a máquina travar.

Se você suspeitar de kernel panic ou oops

kernel.panic=5 kernel.panic_on_oops=5

em seu sysctl.conf ou arquivo equivalente aguardará 5 segundos, possivelmente permitindo que as unidades sejam descarregadas, e então será reinicializado.

Diagnóstico de falha do servidor...Existe algum programa estilo 'gravador de caixa preta' disponível

Responder1

Responder2

Responder3

informação relacionada