使用 GKE 的 Kubernetes 部署中的 Stackdriver 中缺少日誌

2024-6-26 • tag-icon

目前在 GKE 下運行超過 28 個部署，並使用自動 fluidd 收集記錄到 Stackdriver。

主控K8s版本：1.10.6-gke.2
節點版本：1.10.6-gke.2

每分鐘記錄分佈在多個 Pod 中的大約 200 個 JSON 字串。

我們在 Stackdriver 中的日誌攝取方面遇到間歇性間隙。使用檢查日誌時，kubectl我們可以清楚地看到以正確的結構化日誌記錄格式產生的日誌。刪除 Pod/重新部署似乎會暫時恢復攝取。

我已經檢查了 fluidd 及其自動縮放器的日誌是否有錯誤，但它似乎運作正常。

雲端控制台中的 Stackdriver API 配額頁面表示對日誌記錄 API 的某些請求已失敗，儘管我不知道如何顯示 Stackdriver 在使用 GKE 自動日誌擷取時產生的錯誤。配額頁面上報告的錯誤率也不足以解釋我們有時看到的 24 小時以上的差距。

這不是預期的行為，如果您有支援，請打開案例進行進一步調查，否則，請打開錯誤報告這裡。

相關內容