Мне так и не удалось найти в Интернете ничего хорошего для мониторинга клиентских рабочих столов Citrix XenApp.
Обычно проблемы, которые останавливают показ, возникают у пользователей только после того, как они входят в систему и пытаются запустить приложение.
Редко помогает мониторинг запущенных служб Windows, иногда даже они заблокированы и отображаются как запущенные, но все равно требуют перезапуска.
Так как же сообщество решает вопрос мониторинга клиентских рабочих столов Citrix XenApp? Как убедиться, что конечные пользователи могут войти в систему и запустить свои приложения?
Я нашел кое-что о Citrix EdgeSight здесь, на serverfault, и я бы не был против решения вне Nagios, если бы оно могло предупреждать нас, когда сеансы пользователей начинают прерываться.
решение1
По моему опыту, выполнение просто «живых» проверок сервера, служб и т. д. дает мало пользы.
Плохо работающий сервер XenApp может быть почти таким же плохим, как и полностью вышедший из строя. В любом случае пользователи неэффективны, а ваша служба поддержки перегружена звонками.
У себя на работе я использую EdgeSight, предназначенный для мониторинга XenApp, но он уже устарел и не обновлялся, не говоря уже о значительных обновлениях, уже много лет (разработка была давно остановлена, а EdgeSight теперь объединен с XenDesktop).
Несколько вариантов, которые пришли мне на ум и которые я планирую рассмотреть сам (кстати, не имея отношения ни к одному из них):
- Smart-X ControlВверх
- Сплунц+uberAgent для Splunk(последнее написаноХельге Кляйн)
- например Citrix Monitor
Теперь, что касается мониторинга с помощью Nagios, я предполагаю, что он может получать метрики производительности с узлов Windows? Я бы обратил особое внимание на эти метрики производительности (неполный список):
- Использование процессора(короткие пики обычно допустимы, более нескольких секунд при ~95+% или 30 секунд при ~80+% обычно указывают на проблемы)
- Время прерывания ЦП(проблемы с драйверами могут привести к тому, что мощность ЦП будет расходоваться прерываниями, и приложения не смогут ее использовать)
- Контекстных переключений/сек(высокий уровень переключения контекста, указывает на слишком малое количество логических ядер ЦП для обработки рабочей нагрузки)
- Доступная оперативная память(нехватка памяти приводит к чрезмерному подкачке страниц, что в свою очередь снижает производительность пользователя)
- Время занятости диска %(постоянно занятые диски указывают на узкое место диска)
- Чтение/запись дисказадержка (высокая задержка диска немедленно ухудшает работу пользователя. Могут ли диски/RAID-контроллер/SAN обеспечить достаточное количество операций ввода-вывода?)
- Свободное место на диске(нет места на диске, нет рабочего пространства, нет производительности)
- Активные сеансы XenApp(часто можно определить практическое правило максимального количества сеансов, которое можно комфортно разместить на сервере. Рассмотрите возможность включения «количества пользователей» в оценщик нагрузки, чтобы серверы, приближающиеся к этому пределу, с меньшей вероятностью получали новые сеансы пользователей)
Получите историю производительности для этих показателей в вашей реальной среде, определите «красные/желтые/зеленые» значения, затем настройте оповещения.
решение2
Самая очевидная проверка — check_tcp на порт 1494 (стандартный порт ICA). Если это не сработает, пользователи не смогут войти в систему.
Также полезно отслеживать порт 8080 (ica xml) для веб-интерфейса.
О, и еще одно: следите за веб-интерфейсом магазина. Если он выйдет из строя, пользователи также не смогут войти в систему.
решение3
В дополнение к полезным рекомендациям Natxo не забудьте следить за TCP 2598, который используется вместо 1494 для приложений надежности сеанса.
Также отслеживайте количество активных сеансов на всех серверах в вашей ферме. Если один сервер перестает принимать новые входы, вы увидите, что его количество упадет ниже обычного и/или ниже текущего значения других серверов.
Я не очень хорошо знаком с Nagios; быстрый поиск не показывает синтетическую транзакцию для фактического выполнения входа. Однако, если вы сможете найти или написать ее, это будет золото - фактический вход в приложение - этонаиболее правильныйспособ проверить правильность работы XenApp.