如何找出導致 google 容器引擎 CPU 使用率過高的原因?

如何找出導致 google 容器引擎 CPU 使用率過高的原因?

我在容器引擎中有一個單節點集群,如監控儀表板所示,空閒時 CPU 佔用率約為 40%。

當我點擊監控時,所有 Pod 的 cpu 都是 0%。

當我 ssh 進入實例時,我可以看到 docker、kubelet 和 heapster 是罪魁禍首,但我不明白他們在做什麼。

如果我查看日誌,我會看到類似以下的行,每秒重複多次。我猜這是相關的。

gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="-job containers() = OK (0)"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="+job containers()"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="GET /containers/json"

為了弄清楚為什麼會發生這種情況,我下一步該做什麼?

答案1

我最近也有同樣的問題: https://serverfault.com/q/728211/310585

「他們正在做什麼工作」的答案是「日誌記錄和監控」。

為了防止這種開銷,您只需在建立叢集時取消選擇這些功能即可。在開發人員控制台中,有它們的複選框。在 CLI 中將選項新增--no-enable-cloud-logging --no-enable-cloud-monitoringgcloud container clusters create命令中。

相關內容