如何使用 Nagios 監控 Citrix XenApp?

如何使用 Nagios 監控 Citrix XenApp?

我從未在網路上找到任何監控 Citrix XenApp 用戶端桌面的好東西。

通常,停止顯示的問題僅在使用者登入並嘗試啟動應用程式後才會出現。

它很少有助於監視正在運行的 Windows 服務,有時甚至那些已鎖定並顯示為已啟動但仍需要重新啟動的服務。

那麼社群如何解決Citrix XenApp客戶端桌面的監控呢?如何確保最終用戶可以登入並啟動他們的應用程式?

我在 serverfault 上發現了有關 Citrix EdgeSight 的一些內容,我不會反對 Nagios 以外的解決方案,只要它可以在使用者會話開始失敗時向我們發出警報。

答案1

根據我的經驗,僅僅對伺服器、服務等進行「即時」檢查幾乎沒有什麼好處。

效能不佳的 XenApp 伺服器幾乎與完全停止服務的伺服器一樣糟糕 - 無論哪種情況,用戶都無法工作,並且您的幫助台會接到大量電話。

我在我的雇主中使用EdgeSight,它是專為監控XenApp 而定制的,但它已經顯示出它的年齡,並且多年來沒有看到升級,更不用說重大升級了(開發很久以前就停止了, EdgeSight 現在已合併到XenDesktop)。

我的腦海中浮現出一些替代方案,我打算研究一下自己(順便說一下,與其中任何一個都不相關):

現在,至於使用Nagios進行監控,我假設它可以從Windows節點取得效能指標?我會特別注意這些效能指標(不是詳盡的清單):

  • CPU使用率(短峰值通常是可以的,在 ~95+% 時超過幾秒,或在 ~80+% 時持續 30 秒通常表示有問題)
  • CPU中斷時間(驅動程式問題可能會導致CPU電量中斷消耗,無法供應用程式使用)
  • 上下文切換/秒(上下文切換等級較高,表示邏輯 CPU 核心太少,無法處理工作負載)
  • 可用記憶體(記憶體不足會導致過度分頁,進而損害使用者效能)
  • 磁碟繁忙時間百分比(磁碟持續繁忙表示磁碟瓶頸)
  • 磁碟讀/寫延遲(高磁碟延遲會立即損害使用者體驗。磁碟/RAID 控制器/SAN 能否提供足夠的 I/O?)
  • 磁碟可用空間(沒有磁碟空間,沒有工作空間,沒有生產力)
  • 活動 XenApp 會話(通常您可以定義最大會話數的經驗法則,您可以輕鬆地適應伺服器。考慮在負載評估器中包含“使用者計數”,因此接近此限制的伺服器不太可能獲得新的使用者會話)

從您的即時環境中取得這些指標的一些效能歷史記錄,確定您的「紅/黃/綠」值,然後設定警報。

答案2

最明顯的檢查是對連接​​埠 1494(標準 ica 連接埠)的 check_tcp,如果不起作用,使用者將無法登入。

監控 Web 介面的連接埠 8080 (ica xml) 也很有用。

哦,還有一件事:監控商店前台 Web 介面,如果失敗,使用者也將無法登入。

答案3

除了 Natxo 的好建議之外,不要忘記監視 TCP 2598,它用於會話可靠性應用程式而不是 1494。

還可以監控場中所有伺服器的活動會話計數。如果一台伺服器停止接受新的登錄,您將看到其計數低於正常值和/或其他伺服器目前的計數。

我對 Nagios 不太熟悉;快速搜尋不會顯示實際執行登入的綜合事務。但是,如果您能找到或編寫一個,那就太棒了 - 實際登入應用程式就是最正確的測試 XenApp 是否正常運作的方法。

相關內容