Citrix деградирует при 100% загрузке ЦП

Citrix деградирует при 100% загрузке ЦП

У нас есть ферма Citrix PS4.0, состоящая из 2 физических и 2 виртуальных серверов Citrix. Любой из них в какой-то момент в конечном итоге теряет производительность из-за достижения 100% загрузки ЦП. Я вижу скачок загрузки ЦП в клиенте виртуальной инфраструктуры, когда это происходит на любом из серверов VMware.

Это не проблема нагрузки, связанная с количеством пользователей, поскольку она может возникнуть в любое время и с любым количеством пользователей.

Пользователи запускают общие рабочие столы, а не приложения. Установленные на рабочем столе приложения — это стандартные офисные приложения (Word, Excel, Outlook) с ограниченным доступом к Internet Explorer через Bluecoat Proxy и несколько отраслевых приложений.

Какие инструменты можно использовать для устранения неполадок и диагностики источника проблемы? Как только сервер достигает 100% загрузки ЦП, невозможно войти на него и посмотреть, какой процесс потребляет все ресурсы. Единственный выход — сделать полную перезагрузку машины. Все серверы перезапускаются в 4 утра каждое утро по расписанию.

ПРИМЕЧАНИЕ: У меня уже установлен ThreadMaster на всех серверах Citrix с использованием параметров конфигурации по умолчанию и журналирования действий. Журналы не раскрывают источник проблемы.

РЕДАКТИРОВАТЬ

  • Citrix Presentation Server 4.0, корпоративная версия
  • Исправление PSE400W2K3R03
  • Windows 2003 Server Standard Edition с пакетом обновления 1
  • Запускает Symantec Client Security 10.0.0.359, настроенный в соответствии с рекомендациями Citrix по исключениям файлов и т. д.

решение1

Поддержка Windows 2003 SP1 прекращена в апреле, поэтому ваша ОС больше не получает исправлений безопасности. Вам необходимо как можно скорее обновиться до SP2.

В SP2 также есть множество исправлений случайных ошибок — ваша проблема может исчезнуть.

Если в вашей ОС установлен старый уровень исправлений, есть большая вероятность, что некоторые драйверы, в частностидрайверы печати- может быть устаревшим и на коробке. Поскольку драйверы являются большим источником нестабильности системы в целом, я бы попробовал проверить, что они все подписаны и обновлены. Наличие подозрительного драйвера печати объяснило бы, почему это влияет как на виртуальные, так и на физические коробки, и, по-видимому, происходит случайным образом независимо от нагрузки.

О, и к вашему сведению, Citrix 4 переходит в стадию EOM (окончание обслуживания, больше никаких исправлений ошибок) в конце этого месяца, 9 июня, и EOL (окончание жизненного цикла, больше никаких исправлений безопасности или каких-либо других исправлений) в конце декабря 2009. Приятного вам цикла обновлений!

решение2

Вы можете попробовать запланировать запуск скрипта примерно каждую минуту, который будет добавлять список процессов в файл:

pslist >> whatever.txt

Что-то вроде этого может, по крайней мере, дать вам представление о том, что происходит.

(pslist входит в состав Sysinternals Suite)

решение3

ВстроенныйЖурналы производительности и оповещенияtool был бы отличным инструментом, чтобы получить некоторые данные о том, что происходит. Вам придется использовать некоторое дисковое пространство для создания этих журналов, но если вы будете следить за удалением старых файлов журналов до тех пор, пока не возникнет проблема, у вас не должно возникнуть проблем с нехваткой места на диске.

Я бы запустил журнал счетчиков на каждом сервере, регистрируяПроцессиПроцессоробъекты на диск (я бы, наверное, также захватилПамятьобъект тоже).

  • Пуск / Выполнить / PERFMON

  • РазвернутьЖурналы производительности и оповещенияузел и выделитеЖурналы счетчиковузел.

  • НажмитеДействиеиНовые настройки журнала. Назовите журнал так, как вам нравится.

  • Нажмите наДобавить объекты...в окне свойств журнала и добавьте объекты в журнал.

  • Установите интервал. Я бы, наверное, выбрал интервал в 60 секунд или больше. Высокое разрешение, вероятно, не нужно, поскольку это постепенная деградация.

  • НаЛог-файлывкладку, используйтеНастроитькнопку, чтобы выбрать местоположение для файла журнала и базовое имя файла. Я бы выбралМаксимальный размер журналаскажем, 5 МБ - 10 МБ. Это приведет к созданию множества мелких файлов, но вы сможете отслеживать путь, по которому вы храните файлы, и удалять старые файлы, которые накапливаются до возникновения проблемы.

Вы можете запустить журнал, щелкнув правой кнопкой мыши новый экземпляр журнала на панели результатов и выбрав «Запустить». Журнал будет запущен по умолчанию, пока вы его не остановите или не перезагрузите компьютер. (См. этот вопрос для получения информации о запуске журнала при загрузке:Как настроить Perfmon для автоматического запуска «оповещения» при запуске системы? (В вопросе говорится о запуске оповещения, но вы можете использовать ту же команду для запуска журнала.)

Вы можете проанализировать эти журналы вручную после возникновения проблемы. Вы можете попробовать MicrosoftАнализ производительности журналов (PAL)инструмент (http://www.codeplex.com/PAL). Я доволен отчетами, которые генерирует этот инструмент, и он довольно прост в использовании.

решение4

Какую редакцию вы используете и есть ли у вас соглашение SA?

Установлен ли на сервере антивирус?

Кроме того, какие исправления/накопители вы используете для PS4 и какой SP вы используете для Windows?

Связанный контент