DL580 G7 обеспечивает низкую производительность ЦП (E7 4870)

DL580 G7 обеспечивает низкую производительность ЦП (E7 4870)

У меня DL580 G7 с четырьмя E7 4870 и 128 ГБ установленной оперативной памяти (восемь картриджей по 2x 8 ГБ каждый). Операционная система — Ubuntu 18.04. На pcie16 установлен TITAN X и обязательный p410i, но никакой другой периферии. Когда я тестирую эту систему, я получаю около 50% производительности, которую она должна давать. Например, этоэталонный бенчмаркDL580G7 с немного более слабым процессором (E7 4850) и в остальном аналогичной настройкой.

Однако моя система способна выдать только половину производительности в том же бенчмарке (я получаю около 980 для CPU и 20 000 для многоядерной производительности). Это, кажется, неправильно.

Тест показывает все 80 ядер и 128 ГБ оперативной памяти, поэтому оборудование распознается правильно.

Я уже прошел через контрольный список настройки низкой задержки HP и изменил BIOS соответствующим образом. Настройки питания в ILO3 все на максимальной производительности.

Ubuntu настроен на "производительность" регулятора на всех 80 ядрах.
Я заметил, что даже когда я подвергаю систему высокой нагрузке (например, обрабатываю числа на всех 80 ядрах с 100% использованием ЦП в течение нескольких часов), температура ЦП почти не меняется (она остается на уровне 40 градусов), а вентиляторы вообще не вращаются (они остаются на уровне 40%). Общее энергопотребление, отображаемое в ILO3, достигает 650 Вт, но я ожидал бы, что оно будет ближе к 1 кВт в условиях нагрузки. Я немного озадачен этим.

Я уже пробовал разные версии BIOS. Первоначальная версия BIOS была 07/01/2013, что также вызывало проблемы с производительностью у других пользователей (такие отчеты можно найти в интернете). Поэтому я понизил версию до 12/03/2012, и проблема осталась.

Также, когда я сравниваю производительность этой машины с моей предыдущей машиной (с i5 4460), я заметил падение производительности одного ядра в четыре раза на моих приложениях (на неинтенсивных операциях ввода-вывода, таких как добавление большого количества векторов), что согласуется с результатами тестов, но падение производительности одного ядра в два раза было бы тем, чего я ожидал. Меня беспокоит только производительность ЦП. Насколько я могу судить, RAID работает нормально, ввод-вывод, как и ожидалось (но также может пострадать из-за снижения производительности ЦП).

Когда я делаю это cat /proc/cpuinfoво время стрессовых периодов, я вижу, что процессор работает на частоте 2,2 ГГц.

Пока что я не протестировал другую операционную систему. Я собираюсь сделать это, как только у меня появится возможность перезагрузить машину.

решение1

Проверьте настройки управления питанием в BIOS. Убедитесь, что они установлены на OS control. Настройки управления питанием HPE BIOS по умолчанию обеспечивают хорошее энергопотребление, но низкую производительность.

Обычно этот параметр можно найти в разделе: Управление питанием > Регулятор питания HP > Режим управления ОС.

Скриншот BIOS HPE

решение2

Мне не хватает подобных вопросов на Server Fault... но в то же время это нечастый запрос.

Сервер — это старая архитектура. Вы делаете некоторые предположения, которые могут вести вас по неверному пути.

Мои рекомендации:

Вам не следует полагаться только на функции, рекомендованные в руководстве по настройке HP Low-Latency. Это было предназначено для специализированных приложений, таких как алгоритмическая торговля, где целью является детерминизм и предсказуемое использование ресурсов. Характеристики производительности в реальном времени и низкая задержка не обязательно означаютБыстрее.

Я бы посмотрел на возможности процессора и отталкивался от этого...

Intel Xeon E7-4870
Выпущен в 2011 году, снят с производства где-то в 2015 году.

Это процессор с поддержкой Turbo Boost. Максимальная частота турбо составляет 2,80 ГГц. При использовании фиксированной настройки, например "HP Static High Performance Mode",на самом деле он отключает Turbo Boost. В этой ситуации вам лучше использовать режим управления ОС в вашей версии Linux. (Я также рекомендую это для систем VMware!)

Проверьте, возможно ли установить в вашей powertopОС turbostat.

Контролируйте один или оба параметра во время вычислительных циклов.

Я удивлен, что вы смотрите на температуру процессора или энергопотребление. Я никогда не использовал это как показатель того, что делает сервер. Что выявляютсяПри использовании Ubuntu (обычно не поддерживаемого на оборудовании HP ProLiant) отсутствует взаимодействие между ОС и процессором управления ILO. Это одно из дополнительных преимуществ оборудования ProLiant. В системах baremetal я стараюсь использовать ОС типа RHEL/CentOS из-за мониторинга оборудования и интеграции работоспособности.

Также вернитесь к самой последней версии BIOS. Редко когда возникает необходимость понизить версию прошивки системы HP. Также убедитесь, что ваша прошивка ILO3 актуальна.

решение3

Процессор XEON E7-4870 содержит 10 физических ядер. (https://ark.intel.com/products/53579/Intel-Xeon-Processor-E7-4870-30M-Cache-2-40-GHz-6-40-GT-s-Intel-QPI-) Эта конфигурация сервера/ЦП содержит только 40 ядер, а не 80, как заявлено. Возможно, вы путаете ядра и потоки? Кроме того, этот ЦП может достигать максимальной тактовой частоты 2,8 ГГц только при 4 активных ядрах. Таким образом, всего 16 ядер @ 2,8 ГГц против 40 ядер при 2,4 ГГц.

DL580 G7 имеет конфигурации памяти, которые также необходимо учитывать. Самая высокая пропускная способность памяти, достижимая в этой системе (оптимизированный режим полусферы)https://support.hpe.com/hpsc/doc/public/display?docId=c02283239#N100AB) требуется 64 четырехранговых модуля DIMM.

Я знаю, что мой ответ запоздал, но он может быть полезен будущим пользователям; к тому же у меня нет репутации комментатора.

решение4

Сочетание нескольких вещей пошло не так, и я наконец нашел решение вчера вечером! Комбинация понижения версии ПЗУ и настройки регулятора питания на управление ОС сработала. ** Изначально на этом (подержанном) сервере был установлен неисправный BIOS 07/01/2013 (см. [https://blog.netnerds.net/2014/02/solved-degraded-performance-on-hp-dl580-g7-on-bios-v-7012013/]), что делало любые изменения настроек регулирования мощности в ПЗУ бесполезными. ** хотя система давала только 50% производительности, 'cat /proc/cpuinfo' вернул скорость 2,2 ГГц на ядро ​​(немного ниже максимального значения 2,4, но далеко не 50%). Этот результат соответствовал тому, что сообщали другие инструменты, такие как turbostat. Действительно очень странно, и этот факт увеличил мое замешательство. * Я пытался отключить c-states при запуске Linux, но это не помогло (не лучше, не хуже). * Наконец, теперь я получаю 2100 на одном ядре и 36 000 на многоядерном geekbench. Это примерно так с отключенной гиперпоточностью. Я думаю, что с некоторой терпеливой настройкой можно будет преодолеть отметку 40 000 для многоядерного geekbench, но на данный момент я доволен.

Что меня действительно раздражало, так это тот факт, что все инструменты для процессора сообщали о частоте ядра не менее 2,2 ГГц, но моя система была мучительно медленной. Я думаю, что это, должно быть, странный баг 07/01/2013-ROM. Я согласен, что обновление прошивки ROM/ILO до последней было бы лучшим решением, у меня пока не было времени серьезно попробовать это.

Связанный контент