マルチノード LGTM スタックを正しくセットアップする方法

マルチノード LGTM スタックを正しくセットアップする方法

4 つのノード クラスターがあります。

  • モニタリングセンター、ホスティング
    • すべての Prometheus および Loki インスタンスに接続された Grafana + ローカル AlertManager
    • ローカルNodeExporter/AlertManager/Loki/PromtailをスクレイピングするPrometheus(ターゲットごとに1つのジョブ)とルール
    • Slack で構成された Loki、Promtail、NodeExporter、AlertManger
  • 生産/演出/開発、ホスティング
    • 私たちのアプリケーション
    • Redis、PostGreSQL
    • ローカルのNodeExporter/AlertManager/Loki/Promtail/Redis/PostGreSQLをスクレイピングするPrometheus(ターゲットごとに1つのジョブ)とルール
    • Slack で構成された Loki、Promtail、NodeExporter、AlertManger
    • プロメテウス/ロキを暴露するトレーフィック

ノードごとに 1 つの Prometheus/Loki/AlertManager を使用するのが正しい方法なのか、それとも Prometheus ジョブごとに複数のターゲットを持つ、インフラストラクチャ全体に 1 つだけ使用すればよいのか疑問に思っています。

関連情報