Nagios を使用して Citrix XenApp をどのように監視しますか?

Nagios を使用して Citrix XenApp をどのように監視しますか?

Citrix XenApp クライアント デスクトップを監視するための優れたオンライン ツールをこれまで一度も見つけることができませんでした。

通常、ショーを停止させる問題は、ユーザーがログインしてアプリケーションを起動しようとしたときにのみ発生します。

起動中の Windows サービスを監視してもほとんど役に立ちません。場合によっては、Windows サービスがロックされていて、開始済みとして表示されていても、再起動が必要なことがあります。

では、コミュニティは Citrix XenApp クライアント デスクトップの監視をどのように解決するのでしょうか? エンド ユーザーがログインしてアプリを起動できることをどのように確認するのでしょうか?

serverfault で Citrix EdgeSight に関する情報を見つけましたが、ユーザー セッションが失敗し始めたときに警告できる限り、Nagios 以外のソリューションに反対するつもりはありません。

答え1

私の経験では、サーバーやサービスなどの単なる「稼働」チェックを行っても、あまりメリットはありません。

パフォーマンスの悪い XenApp サーバーは、完全にサービス停止しているサーバーとほぼ同じくらい悪い場合があります。どちらの場合も、ユーザーの生産性は低下し、ヘルプデスクには電話が殺到します。

私は勤務先で、XenApp を監視するようにカスタマイズされた EdgeSight を使用していますが、老朽化が目立ち、大幅なアップグレードはおろか、長い間アップグレードも行われていません (開発はずっと前に中止され、EdgeSight は現在 XenDesktop に統合されています)。

私が自分で調べてみようと思っている、頭に浮かんだいくつかの代替案(ちなみに、私はこれらのいずれかと提携しているわけではありません):

さて、Nagios を使用した監視に関しては、Windows ノードからパフォーマンス メトリックを取得できると思いますか? 次のパフォーマンス メトリックに特に注意します (完全なリストではありません)。

  • CPU使用率(短いピークは通常は問題ありませんが、約 95% 以上で数秒以上、または約 80% 以上で 30 秒以上続く場合は、通常、問題があることを示します)
  • CPU割り込み時間(ドライバーの問題により、CPU パワーが割り込みによって消費され、アプリケーションで使用できなくなる可能性があります)
  • コンテキストスイッチ/秒(コンテキスト切り替えのレベルが高いため、ワークロードを処理するには論理 CPU コアが少なすぎることを示します)
  • 使用可能なRAM(メモリ不足により過剰なページングが発生し、ユーザーのパフォーマンスが低下します)
  • ディスク使用率(%)(ディスクが常にビジー状態の場合は、ディスクのボトルネックが発生していることを示します)
  • ディスクの読み取り/書き込みレイテンシ (ディスクのレイテンシが高いと、ユーザー エクスペリエンスがすぐに低下します。ディスク/RAID コントローラー/SAN は十分な I/O を提供できますか?)
  • ディスク空き容量(ディスク容量がないと作業スペースがなくなり、生産性も低下します)
  • アクティブな XenApp セッション(多くの場合、サーバーに快適に収まるセッションの最大数の経験則を定義できます。負荷評価に「ユーザー数」を含めることを検討してください。そうすることで、この制限に近づくサーバーが新しいユーザー セッションを取得する可能性が低くなります)

実際の環境からこれらのメトリックのパフォーマンス履歴を取得し、「赤/黄/緑」の値を決定して、アラートを設定します。

答え2

最も明白なチェックは、ポート 1494 (標準 ica ポート) への check_tcp です。これが機能しない場合、ユーザーはログインできません。

Web インターフェイスのポート 8080 (ica xml) を監視することも役立ちます。

ああ、もう 1 つ: ストアフロントの Web インターフェイスを監視します。これが失敗すると、ユーザーはログインできなくなります。

答え3

Natxo の優れた提案に加えて、セッション信頼性アプリケーションで 1494 の代わりに使用される TCP 2598 を監視することを忘れないでください。

また、ファーム内のすべてのサーバーのアクティブ セッション数も監視します。1 つのサーバーが新しいログインの受け入れを停止すると、そのサーバーでのセッション数が通常の数、または他のサーバーの現在のセッション数よりも少なくなります。

私はNagiosにあまり詳しくありません。ちょっと検索しただけでは、実際にログインを実行するための合成トランザクションは見つかりません。しかし、見つけたり書いたりできれば、それは素晴らしいことです。実際にアプリケーションにログインすることが最も正しいXenApp が正しく機能しているかどうかをテストする方法。

関連情報