Kube-Prometheus-Stack-Redundanz über mehrere Cluster hinweg

Kube-Prometheus-Stack-Redundanz über mehrere Cluster hinweg

Ich verwende derzeit den Kube-Prometheus-Stack, um mehrere Kubernetes-Cluster zu überwachen. Jeder Cluster verfügt über seine eigene Bereitstellung des Kube-Prometheus-Stacks, allerdings gibt es derzeit nur einen Cluster (a), bei dem Alertmanager aktiviert ist. Cluster (a) durchsucht auch alle anderen Cluster/Federate-Endpunkte, um einige Integritätsmetriken zu erhalten und auf dieser Grundlage Alarme zu senden.

Um einen einzelnen Ausfallpunkt für den Fall auszuschließen, dass Cluster (a) ausfällt, möchte ich einen zweiten Cluster (b) mit aktivierter Alarmierung haben, der zusammen mit Cluster (a) im Hochverfügbarkeitsmodus läuft.

Was ist die beste Methode, das zu erreichen?

Bezüglich Prometheus:

Machen Sie sowohl (a) als auch (b) Prometheus genau gleich konfiguriert, abgesehen vielleicht von einem Label zur Identifizierung. Sie sollten die gleichen Daten enthalten und die gleichen Alarme an (a) und (b) Alertmanager auslösen.

Bezüglich Alertmanagern:

Sorgen Sie dafür, dass (a) und (b) Alertmanager miteinander kommunizieren, um Alarme zu deduplizieren. Dies kann erreicht werden durch die Einstellung

alertmanagerSpec:
  additionalPeers: []

Bezüglich Grafana:

Ist es überhaupt möglich, Grafana in einer solchen Bereitstellung hochverfügbar zu machen? Ich weiß vonHierdass Sie Grafana für HA einrichten können, indem Sie beide Instanzen dieselbe Datenbank verwenden lassen, aber wie mache ich das in meinem Setup?

Würde mich freuen wenn jemand Feedback zu dieser Idee geben könnte...

verwandte Informationen