Pegue todos os dados sadc (sar) da produção e analise-os em outra máquina

Pegue todos os dados sadc (sar) da produção e analise-os em outra máquina

sadcestá sendo executado no servidor de produção.

Quando acontece um incidente, quero que o administradorme dê todos os dados(voltando ao passado tanto quanto possível) para que eu possa analisar o incidente e também poder ter levado a ele durante a semana anterior.

Analisar diretamente no servidor de produção me parece uma má ideia porque:

  • A cada hora que passa, os dados anteriores são perdidos devido à rotação de arquivos.
  • Como consultor não tenho acesso ao servidor, então teria que 1. Pergunte ao administrador "Por favor, me dê a saída deste comando sar" 2. Analise 3. Pergunte "Entendo, agora me dê a saída desse outro comando sar" etc. Bem no momento em que o administrador está muito ocupado.
  • Fazer coisas no servidor de produção sempre traz o risco de cometer um erro, então é melhor fazer o máximo possível fora dele.

Então:

  • Posso pedir ao administrador que me envie apenas os dados completos, para que eu possa analisá-los no meu sistema?
  • É tão simples quanto me enviar o /var/log/sa/diretório inteiro? Ou preciso que o administrador me envie outras coisas também?
  • Para analisar os dados, preciso exatamente do mesmo sistema operacional (Red Hat Enterprise Linux Server 6.3)? Ou posso fazer o mesmo no meu Debian? Posso instalar o CentOS, se necessário. Preciso exatamente da mesma versão do sysstat ou deve funcionar se ambos forem recentes (>9.0.4)?

Responder1

Basta pedir:

  • O nome e a versão do sistema operacional,
  • Todo o conteúdo do /var/log/sa/diretório.

É tudo o que você precisa para começar a analisar os dados sar em seu próprio hardware, sem prejudicar o desempenho da produção ou ser atingido por registros contínuos.

Na minha experiência, ter exatamente a mesma versão do sistema operacional não é um requisito estrito, por exemplo, analisei com sucesso os dados sar do CentOS no Ubuntu. Portanto, experimente seu sistema favorito e instale um novo sistema operacional apenas se isso não funcionar.

informação relacionada