Google Container Engine で CPU 使用率が過剰になる原因を特定するにはどうすればよいですか?

Google Container Engine で CPU 使用率が過剰になる原因を特定するにはどうすればよいですか?

コンテナ エンジンに単一ノード クラスターがあり、監視ダッシュボードで確認すると、アイドル状態のときに CPU 使用率が約 40% になっています。

モニタリングをクリックすると、すべてのポッドの CPU 使用率が 0% になります。

インスタンスに ssh で接続すると、docker、kubelet、heapster が主な原因であることがわかりますが、それらがどのような作業を行っているのかはわかりません。

ログを見ると、次のような行が 1 秒間に何度も繰り返されています。これは関連していると思います。

gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="-job containers() = OK (0)"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="+job containers()"
gke-rogue-dev-7248e467-node-9hvh 2015-10-13 19:50:55.000 time="2015-10-13T23:50:55Z" level=info msg="GET /containers/json"

なぜこのようなことが起きているのかを解明するには、次に何をすべきでしょうか?

答え1

最近、私も同じ質問をしました。 https://serverfault.com/q/728211/310585

「彼らが行っている作業は何か」という質問に対する答えは、「ログ記録と監視」です。

--no-enable-cloud-logging --no-enable-cloud-monitoringこのオーバーヘッドを防ぐには、クラスターの作成時にこれらの機能の選択を解除するだけです。開発者コンソールには、これらの機能のチェックボックスがあります。CLI では、コマンドにオプションを追加しますgcloud container clusters create

関連情報