現在、自動 fluentd コレクションを使用して Stackdriver にログ記録する GKE で 28 以上のデプロイメントを実行しています。
マスターK8sバージョン:1.10.6-gke.2
ノードバージョン:1.10.6-gke.2
複数のポッドにまたがって、1 分あたり約 200 個の JSON 文字列をログに記録します。
Stackdriver でのログ取り込みに断続的なギャップが発生しています。 を使用してログを確認すると、kubectl
ログが正しい構造化ログ形式で生成されていることがはっきりとわかります。ポッドを削除したり再デプロイしたりすると、取り込みが一時的に再開されるようです。
fluentd とそのオートスケーラーのログでエラーを確認しましたが、正常に動作しているようです。
クラウド コンソールの Stackdriver API 割り当てページには、ログ記録 API へのリクエストが一部失敗したことが示されていますが、GKE の自動ログ取り込みを使用しているときに Stackdriver によって生成されるエラーを表示する方法がわかりません。割り当てページで報告されるエラー率も、時々発生する 24 時間以上のギャップを説明するにはまったく不十分です。