Robar tiempo: cómo interpretar valores extraños para %st en la parte superior en una instancia EC2

Robar tiempo: cómo interpretar valores extraños para %st en la parte superior en una instancia EC2

Tengo una instancia Amazon EC2 t2.medium que muestra valores de tiempo de robo de CPU muy extraños, en su mayoría números negativos grandes y también números de CPU inactivos muy altos.

¿Algo que explique números tan extraños? ¿Alguna actualización/corrección de errores del sistema que nos falta aquí?

top - 13:36:23 up 51 days,  2:49,  1 user,  load average: 0.35, 0.15, 0.12
Tasks:  97 total,   1 running,  96 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.0%us,  0.0%sy,  0.0%ni,56000.0%id,200.0%wa,  0.0%hi,  0.0%si,-3849124577280.0%st
Mem:   4047964k total,  3905488k used,   142476k free,    29760k buffers
Swap:        0k total,        0k used,        0k free,   269332k cached

Respuesta1

Creo que lo encontré yo mismo, parece que es un error en el área de Kernel/Xen/Kvm, ocurre desde Linux Kernel 4.8 y se solucionó con Linux Kernel 4.11. Ejecutamos 4.9.x, por lo que esto nos afecta, sin embargo, después de todo, no se trata de una situación de robo real, sino simplemente de informes incorrectos debido a un desbordamiento de números dentro del kernel.

Verhttps://0xstubs.org/debugging-a-flaky-cpu-steal-time-counter-on-a-paravirtualized-xen-guest/por un muy buen artículo.

información relacionada