
현재 kube-prometheus-stack을 사용하여 여러 kubernetes 클러스터를 모니터링하고 있습니다. 각 클러스터에는 kube-prometheus-stack의 자체 배포가 있지만 현재는 경고 관리자가 활성화된 클러스터(a)가 하나만 있습니다. 클러스터 (a)는 또한 다른 모든 클러스터/연합 엔드포인트를 스크래핑하여 일부 상태 지표를 얻고 이를 기반으로 경고합니다.
클러스터(a)가 중단되는 경우 단일 실패 지점을 제거하기 위해 클러스터(a)와 함께 고가용성 모드에서 실행되는 경고가 활성화된 두 번째 클러스터(b)를 갖고 싶습니다.
이를 달성하는 가장 좋은 방법은 무엇입니까?
프로메테우스에 관하여:
(a)와 (b) 프로메테우스를 식별용 라벨 외에 정확히 동일한 구성으로 만드세요. 여기에는 동일한 데이터가 포함되어야 하며 (a) 및 (b) 경고 관리자에게 동일한 경고가 발생해야 합니다.
Alertmanager 관련:
(a)와 (b) Alertmanager가 서로 통신하여 경고를 중복 제거하도록 합니다. 이는 설정을 통해 달성할 수 있습니다.
alertmanagerSpec:
additionalPeers: []
Grafana 관련:
이러한 종류의 배포에서 Grafana의 가용성을 높이는 것이 가능합니까? 나는부터 알고 있다여기두 인스턴스가 동일한 데이터베이스를 사용하도록 하여 HA용 Grafana를 설정할 수 있다는 것을 알고 있는데 내 설정에서 이를 수행하는 방법은 무엇입니까?
누군가가 이 아이디어에 대한 피드백을 제공할 수 있다면 기쁠 것입니다...