CPU LOAD Média + quando definir quando limite

CPU LOAD Média + quando definir quando limite

Temos um cluster com máquinas físicas HW

Cada máquina contém 32 CPU

# lscpu
Architecture:          x86_64
CPU op-mode(s):        32-bit, 64-bit
Byte Order:            Little Endian
CPU(s):                32
On-line CPU(s) list:   0-31
Thread(s) per core:    2
Core(s) per socket:    8

Agora queremos enviar um alarme cada vez que a média de carga do tempo de atividade até 5 minutos do tempo de atividade atingir o limite

Entendo que precisamos nos preocupar quando o valor médio de carga (a 5 minutos do tempo de atividade) for superior a 32 (número de CPUs)

Estou correcto ?

Responder1

A média de carga não mostra principalmente a carga da CPU; é uma aproximação do comprimento da fila de itens de trabalho. Na vida real, isso geralmente é influenciado muito mais pelos ciclos de CPU desperdiçados em esperas de E/S do que pelos ciclos de CPU realmente usados ​​(é claro que isso depende da carga de trabalho).

Dê uma olhada na topferramenta para determinar uma primeira estimativa de como suas CPUs gastam seu tempo. Como regra geral (eapenascomo tal) considere

  • Altas Userporcentagens são saudáveis ​​– sua máquina está em bom uso
  • Porcentagens altas Syspodem indicar um aplicativo não muito eficiente (ou convidados da VM executando uma combinação de sistema operacional/driver não otimizada)
  • Tempos altos Waitsignificam que sua E/S (provavelmente armazenamento) não consegue acompanhar. Isso pode novamente apontar para a necessidade de otimização dentro do seu aplicativo ou apenas exigir demais do seu hardware de armazenamento (Principais lugares para procurar: os discos rotativos são usados ​​para cargas de trabalho sensíveis à latência? Você está usando o RAID5 para pequenas gravações?)

informação relacionada