
매우 이상한 CPU Steal Time 값(주로 큰 음수 및 매우 높은 유휴 CPU 번호)을 표시하는 Amazon EC2 t2.medium 인스턴스가 있습니다.
그런 이상한 숫자를 설명하는 것이 있나요? 여기서 누락된 시스템 업데이트/버그 수정이 있습니까?
top - 13:36:23 up 51 days, 2:49, 1 user, load average: 0.35, 0.15, 0.12
Tasks: 97 total, 1 running, 96 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.0%sy, 0.0%ni,56000.0%id,200.0%wa, 0.0%hi, 0.0%si,-3849124577280.0%st
Mem: 4047964k total, 3905488k used, 142476k free, 29760k buffers
Swap: 0k total, 0k used, 0k free, 269332k cached
답변1
제가 직접 찾은 것 같습니다. 이것은 Kernel/Xen/Kvm 영역의 버그인 것 같습니다. 이 문제는 Linux Kernel 4.8부터 발생했으며 Linux Kernel 4.11에서 수정되었습니다. 우리는 4.9.x를 실행하므로 이에 영향을 받습니다. 그러나 이는 결국 실제 도용 상황이 아니라 커널 내부의 숫자 오버플로로 인한 잘못된 보고일 뿐입니다.
보다https://0xstubs.org/debugging-a-flaky-cpu-steal-time-counter-on-a-paravirtualized-xen-guest/아주 좋은 글을 위해.