我從未在網路上找到任何監控 Citrix XenApp 用戶端桌面的好東西。
通常,停止顯示的問題僅在使用者登入並嘗試啟動應用程式後才會出現。
它很少有助於監視正在運行的 Windows 服務,有時甚至那些已鎖定並顯示為已啟動但仍需要重新啟動的服務。
那麼社群如何解決Citrix XenApp客戶端桌面的監控呢?如何確保最終用戶可以登入並啟動他們的應用程式?
我在 serverfault 上發現了有關 Citrix EdgeSight 的一些內容,我不會反對 Nagios 以外的解決方案,只要它可以在使用者會話開始失敗時向我們發出警報。
答案1
根據我的經驗,僅僅對伺服器、服務等進行「即時」檢查幾乎沒有什麼好處。
效能不佳的 XenApp 伺服器幾乎與完全停止服務的伺服器一樣糟糕 - 無論哪種情況,用戶都無法工作,並且您的幫助台會接到大量電話。
我在我的雇主中使用EdgeSight,它是專為監控XenApp 而定制的,但它已經顯示出它的年齡,並且多年來沒有看到升級,更不用說重大升級了(開發很久以前就停止了, EdgeSight 現在已合併到XenDesktop)。
我的腦海中浮現出一些替代方案,我打算研究一下自己(順便說一下,與其中任何一個都不相關):
現在,至於使用Nagios進行監控,我假設它可以從Windows節點取得效能指標?我會特別注意這些效能指標(不是詳盡的清單):
- CPU使用率(短峰值通常是可以的,在 ~95+% 時超過幾秒,或在 ~80+% 時持續 30 秒通常表示有問題)
- CPU中斷時間(驅動程式問題可能會導致CPU電量中斷消耗,無法供應用程式使用)
- 上下文切換/秒(上下文切換等級較高,表示邏輯 CPU 核心太少,無法處理工作負載)
- 可用記憶體(記憶體不足會導致過度分頁,進而損害使用者效能)
- 磁碟繁忙時間百分比(磁碟持續繁忙表示磁碟瓶頸)
- 磁碟讀/寫延遲(高磁碟延遲會立即損害使用者體驗。磁碟/RAID 控制器/SAN 能否提供足夠的 I/O?)
- 磁碟可用空間(沒有磁碟空間,沒有工作空間,沒有生產力)
- 活動 XenApp 會話(通常您可以定義最大會話數的經驗法則,您可以輕鬆地適應伺服器。考慮在負載評估器中包含“使用者計數”,因此接近此限制的伺服器不太可能獲得新的使用者會話)
從您的即時環境中取得這些指標的一些效能歷史記錄,確定您的「紅/黃/綠」值,然後設定警報。
答案2
最明顯的檢查是對連接埠 1494(標準 ica 連接埠)的 check_tcp,如果不起作用,使用者將無法登入。
監控 Web 介面的連接埠 8080 (ica xml) 也很有用。
哦,還有一件事:監控商店前台 Web 介面,如果失敗,使用者也將無法登入。
答案3
除了 Natxo 的好建議之外,不要忘記監視 TCP 2598,它用於會話可靠性應用程式而不是 1494。
還可以監控場中所有伺服器的活動會話計數。如果一台伺服器停止接受新的登錄,您將看到其計數低於正常值和/或其他伺服器目前的計數。
我對 Nagios 不太熟悉;快速搜尋不會顯示實際執行登入的綜合事務。但是,如果您能找到或編寫一個,那就太棒了 - 實際登入應用程式就是最正確的測試 XenApp 是否正常運作的方法。