DL580 G7 ofrece solo bajo rendimiento en la CPU (E7 4870)

DL580 G7 ofrece solo bajo rendimiento en la CPU (E7 4870)

Tengo un DL580 G7 con cuatro E7 4870 y 128 GB de RAM instalados (ocho cartuchos con 2x 8 GB cada uno). El sistema operativo es Ubuntu 18.04. Hay un TITAN X en el pcie16 y el obligatorio p410i instalado, pero ningún otro periférico. Cuando comparo este sistema, obtengo aproximadamente el 50% del rendimiento que debería ofrecer. Por ejemplo este es unpunto de referenciade un DL580G7 con una CPU ligeramente más débil (E7 4850) y una configuración similar.

Sin embargo, mi sistema sólo es capaz de producir la mitad del rendimiento en el mismo punto de referencia (obtengo alrededor de 980 para la CPU y 20.000 de rendimiento multinúcleo). Esto no parece correcto.

El punto de referencia muestra los 80 núcleos y 128 GB de RAM, por lo que el hardware se reconoce correctamente.

Ya revisé la lista de verificación de ajuste de baja latencia de HP y cambié el BIOS en consecuencia. Todas las configuraciones de energía en ILO3 están en rendimiento máximo.

Ubuntu está configurado como regulador de "rendimiento" en los 80 núcleos.
Me di cuenta de que incluso cuando pongo el sistema bajo un alto estrés (como hacer números en los 80 núcleos con un uso del 100 % de la CPU durante horas), el calor de la CPU apenas cambia (permanecen a 40 grados) y los ventiladores no giran. en absoluto (se quedan en el 40%). El consumo total de energía mostrado en ILO3 sube a 650 vatios, pero esperaría que se acerque más a 1 KW en condiciones de estrés. Estoy un poco desconcertado por esto.

Ya probé diferentes versiones de BIOS. El BIOS original era del 01/07/2013, lo que también ha causado problemas de rendimiento a otros usuarios (dichos informes se encuentran en Internet). Así que lo bajé al 03/12/2012 y el problema persiste.

Además, cuando comparo el rendimiento de esta máquina con mi máquina anterior (que tenía un i5 4460), noté una caída en el rendimiento de un solo núcleo por un factor de cuatro en mis aplicaciones (en cosas que no requieren mucha E/S, como agregar una gran cantidad de vectores). lo cual es consistente con los resultados en los puntos de referencia, pero lo que esperaba sería una caída en el rendimiento de un solo núcleo del factor dos. Sólo me preocupa el rendimiento de la CPU. Por lo que puedo ver, el RAID está funcionando bien, IO es el esperado (pero también podría verse afectado debido a la disminución del rendimiento de la CPU).

Cuando hago una cat /proc/cpuinfodurante los períodos de estrés, veo que las CPU están funcionando a 2,2 Ghz.

Hasta ahora lo que no he hecho todavía es probar un sistema operativo diferente. Lo haré tan pronto como tenga la oportunidad de reiniciar la máquina.

Respuesta1

Verifique la configuración de administración de energía en el BIOS. Asegúrese de que estén configurados en controlados por el sistema operativo. La configuración predeterminada de administración de energía del BIOS de HPE da como resultado un buen uso de energía pero un rendimiento deficiente.

Por lo general, esta configuración se puede encontrar en: Administración de energía > Regulador de energía HP > Modo de control del sistema operativo.

Captura de pantalla del BIOS de HPE

Respuesta2

Extraño ver preguntas como esta en Server Fault... pero al mismo tiempo, no es una solicitud común.

El servidor es una arquitectura antigua. Estás haciendo algunas suposiciones que podrían llevarte por el camino equivocado.

Mis recomendaciones:

No debe confiar únicamente en las funciones recomendadas en la guía de ajuste de baja latencia de HP. Esto estaba destinado a aplicaciones especializadas como el comercio algorítmico, donde el objetivo es el determinismo y la utilización predecible de los recursos. Las características de rendimiento en tiempo real y la baja latencia no significan necesariamentemás rápido.

Miraría las capacidades de la CPU y trabajaría desde allí...

Intel Xeon E7-4870
Lanzado en 2011, llegó al final de su vida útil en algún momento de 2015.

Esta es una CPU compatible con Turbo Boost. La frecuencia turbo máxima es de 2,80 GHz. Cuando utiliza una configuración fija como "Modo de alto rendimiento estático HP",en realidad desactiva Turbo Boost. En esta situación, sería mejor que utilizara el modo de control del sistema operativo en su versión de Linux. (¡También recomiendo esto para sistemas VMware!)

Dentro de su sistema operativo, vea si es posible instalar powertopy turbostat.

Supervise uno o ambos durante sus ejecuciones computacionales.

Me sorprende que estés mirando las temperaturas de la CPU o el consumo de energía. Nunca he usado eso como indicador de lo que está haciendo el servidor. Lo que tusonLo que falta al usar Ubuntu (generalmente no compatible con el hardware HP ProLiant) es la interacción entre el sistema operativo y el procesador de administración de ILO. Este es uno de los valores agregados de los equipos ProLiant. Con los sistemas baremetal, intento usar un sistema operativo similar a RHEL/CentOS debido a la supervisión del hardware y la integración del estado.

Además, regrese a la revisión más reciente del BIOS. Rara vez hay una razón para degradar el firmware del sistema HP. Asegúrese también de que el firmware de ILO3 esté actualizado.

Respuesta3

La CPU XEON E7-4870 contiene 10 núcleos físicos. (https://ark.intel.com/products/53579/Intel-Xeon-Processor-E7-4870-30M-Cache-2-40-GHz-6-40-GT-s-Intel-QPI-) Esta configuración de servidor/CPU solo contiene 40 núcleos, no 80 como se indica. ¿Es posible que esté confundiendo núcleos e hilos? Además, esta CPU sólo puede alcanzar la frecuencia de reloj más alta de 2,8 GHz con 4 núcleos activos. Entonces, un total de 16 núcleos a 2,8 GHz frente a 40 núcleos a 2,4 GHz.

El DL580 G7 tiene configuraciones de memoria que también deben tenerse en cuenta. El ancho de banda de memoria más alto que se puede lograr en este sistema (modo de hemisferio optimizadohttps://support.hpe.com/hpsc/doc/public/display?docId=c02283239#N100AB) requiere 64 DIMM de cuatro rangos.

Sé que mi respuesta llega tarde al juego, pero podría ayudar a futuros buscadores; y no tengo reputación de hacer comentarios.

Respuesta4

¡Una combinación de cosas salió mal y finalmente encontré la solución anoche! La combinación de degradar la ROM y configurar el regulador de energía en controlado por el sistema operativo funcionó. ** Inicialmente este servidor (de segunda mano) tenía instalada la BIOS defectuosa del 01/07/2013 (ver [https://blog.netnerds.net/2014/02/solved-degraded-rendimiento-on-hp-dl580-g7-on-bios-v-7012013/]), lo que hizo que cualquier cambio en la configuración de la regulación de potencia en la ROM fuera ineficaz. ** a pesar de que el sistema sólo estaba dando el 50% del rendimiento, un 'cat /proc/cpuinfo' devolvió una velocidad de 2,2ghz por núcleo (ligeramente inferior al máximo de 2,4, pero muy lejos de sólo el 50% ). Este resultado fue consistente con lo que informaron otras herramientas como el turbostato. Muy extraño en verdad y este hecho aumentó mi confusión. * Intenté deshabilitar los estados c en el inicio de Linux, pero eso no ayudó (ni mejor ni peor). * Finalmente, ahora obtengo 2100 en un solo núcleo y 36,000 en geekbench multinúcleo. Eso es correcto con el hyperthreading deshabilitado. Supongo que con algunos ajustes pacientes debería ser posible superar la marca de 40.000 para el geekbench multinúcleo, pero por el momento estoy satisfecho.

Lo que realmente me molestó fue el hecho de que todas las herramientas de la CPU informaron una velocidad central de al menos 2,2 GHz, pero mi sistema era tremendamente lento. Creo que este debe ser algún error de la ROM del 01/07/2013. Estoy de acuerdo en que actualizar el firmware ROM/ILO al último sería lo mejor, no tuve tiempo de intentarlo seriamente todavía.

información relacionada