目前在 GKE 下運行超過 28 個部署,並使用自動 fluidd 收集記錄到 Stackdriver。
主控K8s版本:1.10.6-gke.2
節點版本:1.10.6-gke.2
每分鐘記錄分佈在多個 Pod 中的大約 200 個 JSON 字串。
我們在 Stackdriver 中的日誌攝取方面遇到間歇性間隙。使用檢查日誌時,kubectl
我們可以清楚地看到以正確的結構化日誌記錄格式產生的日誌。刪除 Pod/重新部署似乎會暫時恢復攝取。
我已經檢查了 fluidd 及其自動縮放器的日誌是否有錯誤,但它似乎運作正常。
雲端控制台中的 Stackdriver API 配額頁面表示對日誌記錄 API 的某些請求已失敗,儘管我不知道如何顯示 Stackdriver 在使用 GKE 自動日誌擷取時產生的錯誤。配額頁面上報告的錯誤率也不足以解釋我們有時看到的 24 小時以上的差距。