Kubernetes 叢集中 Cadvisor container_network_receive_bytes_total 指標出現峰值

Kubernetes 叢集中 Cadvisor container_network_receive_bytes_total 指標出現峰值

概括:

我在多個 Kubernetes (k8s) 叢集中使用 Cadvisor 和 Prometheus 來監控網路流量使用情況。我在查詢中使用 container_network_receive_bytes_total 指標來計算總網路流量使用量。然而,我在其中一個集群中遇到了一個不尋常的問題。

問題:

在我的一個叢集中,我有一個非生產資料庫,已經平穩運行了 20 天。然而,從昨天開始,container_network_receive_bytes_total 指標的使用量顯著增加,儘管我確信負載沒有增加。這個問題並不是孤立的。我曾多次遇到類似的情況,而且它們似乎都發生在這個特定的集群中。我嘗試了多種方法來重現它,但我無法做到這一點。

這是我正在使用的查詢:

(
    sum (
        increase (
            container_network_transmit_bytes_total{namespace="TEST"}[2d]
        )
    ) by (node, cluster, namespace, pod)
) / 1000000000

這就是峰值: 這裡

我相信此問題的根本原因在於該集群內,但我正在尋求有關如何排除故障和解決該問題的指導或線索。

相關內容