DL580 G7 oferecendo apenas baixo desempenho na CPU (E7 4870)

DL580 G7 oferecendo apenas baixo desempenho na CPU (E7 4870)

Tenho um DL580 G7 com quatro E7 4870 e 128gb de RAM instalados (oito cartuchos com 2x 8gb cada). O sistema operacional é Ubuntu 18.04. Há um TITAN X no pcie16 e o ​​obrigatório p410i instalado, mas nenhum outro periférico. Quando faço benchmark deste sistema, obtenho cerca de 50% do desempenho que ele deveria oferecer. Por exemplo este é umreferência de referênciade um DL580G7 com uma CPU um pouco mais fraca (E7 4850) e uma configuração semelhante.

No entanto, meu sistema só é capaz de produzir metade do desempenho no mesmo benchmark (obtenho cerca de 980 para a CPU e 20.000 de desempenho multicore). Isto não parece estar certo.

O benchmark mostra todos os 80 núcleos e 128 GB de RAM, então o hardware é reconhecido corretamente.

Já passei pela lista de verificação de ajuste de baixa latência da HP e alterei o BIOS de acordo. As configurações de energia no ILO3 estão todas no desempenho máximo.

O Ubuntu está configurado para o governador de "desempenho" em todos os 80 núcleos.
Percebi que mesmo quando coloco o sistema sob alto estresse (como processar números em todos os 80 núcleos com 100% de uso da CPU por horas), o calor da CPU quase não muda (eles permanecem em 40 graus) e os ventiladores não giram. nada (eles ficam em 40%). O consumo total de energia exibido no ILO3 vai até 650 Watts, mas eu esperaria que fosse mais próximo de 1KW sob condições de estresse. Estou um pouco confuso com isso.

Já experimentei diferentes versões de BIOS. O BIOS original era 01/07/2013, o que também causou problemas de desempenho para outros usuários (tais relatórios são encontrados na internet). Então fiz o downgrade para 03/12/2012 e o problema permanece.

Além disso, quando comparo o desempenho desta máquina com a minha máquina anterior (com um i5 4460), notei uma queda no desempenho de núcleo único pelo fator de quatro em meus aplicativos (em coisas que não exigem muita E/S, como adicionar um grande número de vetores), o que é consistente com os resultados dos benchmarks, mas uma queda no desempenho de núcleo único do fator dois seria o que eu esperava. Estou preocupado apenas com o desempenho da CPU. Pelo que posso ver, o RAID está funcionando bem, o IO está conforme o esperado (mas também pode sofrer devido à diminuição do desempenho da CPU).

Quando faço isso cat /proc/cpuinfodurante períodos de estresse, vejo que as CPUs estão rodando a 2,2Ghz.

Até agora o que ainda não fiz foi testar um sistema operacional diferente. Farei isso assim que tiver a oportunidade de reiniciar a máquina.

Responder1

Verifique as configurações de gerenciamento de energia no BIOS. Certifique-se de que eles estejam configurados para serem controlados pelo sistema operacional. As configurações padrão de gerenciamento de energia do BIOS HPE resultam em bom uso de energia, mas baixo desempenho.

Normalmente, essa configuração pode ser encontrada em: Gerenciamento de energia > Regulador de energia HP > Modo de controle do sistema operacional.

Captura de tela do BIOS HPE

Responder2

Sinto falta de ver perguntas como essa sobre Server Fault... mas, ao mesmo tempo, não é uma solicitação comum.

O servidor é uma arquitetura antiga. Você está fazendo algumas suposições que podem estar levando você ao caminho errado.

Minhas recomendações:

Você não deve confiar apenas nos recursos recomendados no guia de ajuste de baixa latência da HP. Isso foi pensado para aplicações especializadas, como negociação algorítmica, onde o objetivo é o determinismo e a utilização previsível de recursos. As características de desempenho em tempo real e a baixa latência não significam necessariamentemais rápido.

Eu examinaria as capacidades da CPU e trabalharia a partir daí ...

Intel Xeon E7-4870
Lançado em 2011, chegou ao fim em 2015.

Esta é uma CPU compatível com Turbo Boost. A frequência turbo máxima é 2,80 GHz. Ao usar uma configuração fixa como "Modo HP Static High Performance",na verdade desativa o Turbo Boost. Nessa situação, seria melhor usar o modo de controle do sistema operacional no seu tipo de Linux. (Eu também recomendo isso para sistemas VMware!)

Dentro do seu SO, veja se é possível instalar powertope turbostat.

Monitore um ou ambos durante suas execuções computacionais.

Estou surpreso que você esteja observando as temperaturas da CPU ou o consumo de energia. Nunca usei isso como uma medida do que o servidor está fazendo. O que vocêsãoO que falta no uso do Ubuntu (geralmente sem suporte no hardware HP ProLiant) é a interação entre o sistema operacional e o processador de gerenciamento da OIT. Este é um dos valores agregados do equipamento ProLiant. Com sistemas baremetal, tento usar um sistema operacional semelhante ao RHEL/CentOS por causa do monitoramento de hardware e integração de integridade.

Além disso, volte para a revisão mais atual do BIOS. Raramente há um motivo para fazer downgrade do firmware do sistema HP. Certifique-se também de que seu firmware ILO3 esteja atualizado.

Responder3

A CPU XEON E7-4870 contém 10 núcleos físicos. (https://ark.intel.com/products/53579/Intel-Xeon-Processor-E7-4870-30M-Cache-2-40-GHz-6-40-GT-s-Intel-QPI-) Esta configuração de servidor/CPU contém apenas 40 núcleos, não 80 conforme indicado. É possível que você esteja confundindo núcleos e threads? Além disso, esta CPU só pode atingir a freqüência mais alta de 2,8 GHz com 4 núcleos ativos. Portanto, um total de 16 núcleos a 2,8 GHz versus 40 núcleos a 2,4 GHz.

O DL580 G7 possui configurações de memória que também precisam ser levadas em consideração. A maior largura de banda de memória alcançável neste sistema (modo hemisfério otimizadohttps://support.hpe.com/hpsc/doc/public/display?docId=c02283239#N100AB) requer 64 DIMMs de classificação quádrupla.

Sei que minha resposta está atrasada, mas pode ajudar futuros pesquisadores; e não tenho reputação de comentar.

Responder4

Uma combinação de coisas deu errado e finalmente encontrei a solução ontem à noite! A combinação de fazer o downgrade da ROM e configurar o regulador de energia para controlado pelo sistema operacional funcionou. ** Inicialmente este servidor (de segunda mão) tinha o BIOS defeituoso 01/07/2013 instalado (veja [https://blog.netnerds.net/2014/02/solved-degraded-performance-on-hp-dl580-g7-on-bios-v-7012013/]), o que tornou ineficaz qualquer alteração na configuração da regulação de potência na ROM. ** mesmo que o sistema estivesse dando apenas 50% do desempenho, um 'cat /proc/cpuinfo' retornou uma velocidade de 2,2ghz por núcleo (um pouco menor que o máximo de 2,4, mas longe de apenas 50% ). Este resultado foi consistente com o que outras ferramentas como o turbostato relataram. Realmente muito estranho e esse fato aumentou minha confusão. * Tentei desabilitar c-states na inicialização do Linux, mas isso não ajudou (nem melhor, nem pior). * Finalmente agora consigo 2.100 no single core e 36.000 no geekbench multicore. Isso está certo com o hyperthreading desativado. Acho que com alguns ajustes pacientes deve ser possível ultrapassar a marca de 40.000 para o geekbench multicore, mas por enquanto estou satisfeito.

O que realmente me incomodou foi o fato de que todas as ferramentas de CPU relataram uma velocidade central de pelo menos 2,2 GHz, mas meu sistema estava dolorosamente lento. Acho que esse deve ser um bug estranho da ROM de 01/07/2013. Concordo que atualizar o firmware ROM/ILO para o mais recente seria o melhor, ainda não tive tempo para tentar seriamente.

informação relacionada