No puedo entender el motivo del alto promedio de carga (LA)

No puedo entender el motivo del alto promedio de carga (LA)

Obtuve un servidor básico con CPU de 32 núcleos/64 núcleos y 64 GB de RAM. Ubuntu 18.04 integrado. Ejecutando pgsql (carga baja), ~250 contenedores acoplables con Python para trabajo en red. Htop, muéstrame LA 120 (5/1/15 minutos), pero no puedo encontrar el motivo.

  • htop muestra ~50% de carga de todos los núcleos
  • Tengo 12 GB de RAM libres
  • vnstat -l muestra una carga del 25% en el adaptador de red (en resumen de ambos lados)
  • mostrar superior wa (iowait) 0.0
  • iostat no muestra nada escrito en los discos duros, iotop a veces muestra procesos con escritura de 10 a 20 Kb/s en un segundo.
  • encima no muestran líneas rojas. Todo gris (bueno).
  • "ps -eo stat | grep -c D" y "ps -eo stat | grep -c D" muestran "1"

Creo que revisé todo: CPU, RAM, HDD, red. Entiendo la raíz del gran LA: contenedores con Python. Pero quiero encontrar un cuello de botella para la optimización. ¿Dónde puedo ver más una razón de alto LA?

ACTUALIZACIÓN:Algunos adicionales. Creo que hay un cuello de botella en algún lugar de la CPU porque si uso pypy en conrainers LA baja, si uso pyhton simple, LA crece. Pero no puedo entender el desde entonces porque htop siempre muestra una carga de CPU <100%.

Respuesta1

El promedio de carga de Linux es la cantidad de procesos actualmente (activamente) ejecutándose o esperando ejecución.

Tiene 250 contenedores Docker más procesos del sistema y sus herramientas de monitoreo. Se trata simplemente de una gran cantidad de procesos. Depende un poco de lo que se ejecuta dentro de sus contenedores y de la frecuencia con la que los procesos se activan para hacer algo. Si reduce la cantidad de contenedores Docker en un 50% y el promedio de carga también disminuye en un 50%, entonces usted tiene el culpable.

información relacionada