Как контролировать Citrix XenApp с помощью Nagios?

Как контролировать Citrix XenApp с помощью Nagios?

Мне так и не удалось найти в Интернете ничего хорошего для мониторинга клиентских рабочих столов Citrix XenApp.

Обычно проблемы, которые останавливают показ, возникают у пользователей только после того, как они входят в систему и пытаются запустить приложение.

Редко помогает мониторинг запущенных служб Windows, иногда даже они заблокированы и отображаются как запущенные, но все равно требуют перезапуска.

Так как же сообщество решает вопрос мониторинга клиентских рабочих столов Citrix XenApp? Как убедиться, что конечные пользователи могут войти в систему и запустить свои приложения?

Я нашел кое-что о Citrix EdgeSight здесь, на serverfault, и я бы не был против решения вне Nagios, если бы оно могло предупреждать нас, когда сеансы пользователей начинают прерываться.

решение1

По моему опыту, выполнение просто «живых» проверок сервера, служб и т. д. дает мало пользы.

Плохо работающий сервер XenApp может быть почти таким же плохим, как и полностью вышедший из строя. В любом случае пользователи неэффективны, а ваша служба поддержки перегружена звонками.

У себя на работе я использую EdgeSight, предназначенный для мониторинга XenApp, но он уже устарел и не обновлялся, не говоря уже о значительных обновлениях, уже много лет (разработка была давно остановлена, а EdgeSight теперь объединен с XenDesktop).

Несколько вариантов, которые пришли мне на ум и которые я планирую рассмотреть сам (кстати, не имея отношения ни к одному из них):

Теперь, что касается мониторинга с помощью Nagios, я предполагаю, что он может получать метрики производительности с узлов Windows? Я бы обратил особое внимание на эти метрики производительности (неполный список):

  • Использование процессора(короткие пики обычно допустимы, более нескольких секунд при ~95+% или 30 секунд при ~80+% обычно указывают на проблемы)
  • Время прерывания ЦП(проблемы с драйверами могут привести к тому, что мощность ЦП будет расходоваться прерываниями, и приложения не смогут ее использовать)
  • Контекстных переключений/сек(высокий уровень переключения контекста, указывает на слишком малое количество логических ядер ЦП для обработки рабочей нагрузки)
  • Доступная оперативная память(нехватка памяти приводит к чрезмерному подкачке страниц, что в свою очередь снижает производительность пользователя)
  • Время занятости диска %(постоянно занятые диски указывают на узкое место диска)
  • Чтение/запись дисказадержка (высокая задержка диска немедленно ухудшает работу пользователя. Могут ли диски/RAID-контроллер/SAN обеспечить достаточное количество операций ввода-вывода?)
  • Свободное место на диске(нет места на диске, нет рабочего пространства, нет производительности)
  • Активные сеансы XenApp(часто можно определить практическое правило максимального количества сеансов, которое можно комфортно разместить на сервере. Рассмотрите возможность включения «количества пользователей» в оценщик нагрузки, чтобы серверы, приближающиеся к этому пределу, с меньшей вероятностью получали новые сеансы пользователей)

Получите историю производительности для этих показателей в вашей реальной среде, определите «красные/желтые/зеленые» значения, затем настройте оповещения.

решение2

Самая очевидная проверка — check_tcp на порт 1494 (стандартный порт ICA). Если это не сработает, пользователи не смогут войти в систему.

Также полезно отслеживать порт 8080 (ica xml) для веб-интерфейса.

О, и еще одно: следите за веб-интерфейсом магазина. Если он выйдет из строя, пользователи также не смогут войти в систему.

решение3

В дополнение к полезным рекомендациям Natxo не забудьте следить за TCP 2598, который используется вместо 1494 для приложений надежности сеанса.

Также отслеживайте количество активных сеансов на всех серверах в вашей ферме. Если один сервер перестает принимать новые входы, вы увидите, что его количество упадет ниже обычного и/или ниже текущего значения других серверов.

Я не очень хорошо знаком с Nagios; быстрый поиск не показывает синтетическую транзакцию для фактического выполнения входа. Однако, если вы сможете найти или написать ее, это будет золото - фактический вход в приложение - этонаиболее правильныйспособ проверить правильность работы XenApp.

Связанный контент