Google 컨테이너 엔진에서 과도한 CPU 사용량을 유발하는 원인을 어떻게 파악하나요?

Google 컨테이너 엔진에서 과도한 CPU 사용량을 유발하는 원인을 어떻게 파악하나요?

모니터링 대시보드에서 볼 수 있듯이 유휴 상태일 때 CPU가 ~40%인 컨테이너 엔진의 단일 노드 클러스터가 있습니다.

모니터링을 클릭하면 모든 포드의 CPU가 0%입니다.

인스턴스에 ssh 접속하면 docker, kubelet, heapster가 주범이라는 것을 알 수 있지만 이들이 무슨 작업을 하는지는 모르겠습니다.

로그를 보면 다음과 같은 줄이 초당 여러 번 반복되는 것을 볼 수 있습니다. 나는 이것이 관련이 있다고 생각합니다.

gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="-job containers() = OK (0)"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="+job containers()"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="GET /containers/json"

왜 이런 일이 발생하는지 알아내기 위한 다음 단계는 무엇입니까?

답변1

나는 최근에 같은 질문을 받았습니다. https://serverfault.com/q/728211/310585

"무슨 일을 하고 있는가"에 대한 답은 "로깅과 모니터링"이다.

이러한 오버헤드를 방지하려면 클러스터를 생성할 때 해당 기능을 선택 취소하면 됩니다. 개발자 콘솔에는 해당 확인란이 있습니다. CLI에서 명령 --no-enable-cloud-logging --no-enable-cloud-monitoring에 옵션을 추가합니다 gcloud container clusters create.

관련 정보