¿Consideraciones sobre el uso de GPU de clase de consumidor (gama alta) en el servidor?

¿Consideraciones sobre el uso de GPU de clase de consumidor (gama alta) en el servidor?

Motivación:

En primer lugar, aunque tengo algunos conocimientos de informática, desarrollo de software y administración de servidores Linux, nunca he investigado el hardware de un servidor y soy un "novato" total en ello. Lo siento si esta pregunta es trivial para la mayoría de ustedes.

Estoy desarrollando un software con necesidades informáticas bastante intensivas (de un solo punto). Para llegar a los TFlops requeridos, seleccioné el marco OpenCL (2.1) y realicé la mayor parte del cálculo en una tarjeta gráfica AMD de consumo de gama alta, utilizando la CPU principalmente para maneja la GPU (sistema operativo Linux). Ahora estoy buscando extender esto a través de varias máquinas.

Al analizar cómo organizar esas máquinas, rápidamente se hizo evidente que las torres ATX estándar (de consumo) no son ideales: cada marca tiene su propia forma de chasis, básicamente no se pueden apilar fácil y cómodamente en un gabinete de 19", con un buen flujo de aire de refrigeración. , APC compartido, gestión de cables, etc.

Con este objetivo, comencé a buscar un gabinete rack con servidores y encontré que:

  • Las GPU diseñadas para HPC como Instinct/Tesla cuestan un orden de magnitud más que las GPU de consumo, principalmente para ofrecer doble punto flotante que son "lentos" en los dispositivos de consumo (y porque se pueden vender a ese precio a las empresas).
  • Incluso con esas GPU, se necesita un espaciador PCI-Express
  • Los servidores preparados para GPU solo permiten tarjetas gráficas de hasta 2 ranuras (las GPU de consumo actuales de gama alta suelen tener 3 ranuras).
  • Encontré chasis ATX 3U o 4U diseñados para gabinetes de 19". ¡Pero bueno! montar uno de esos con hardware de consumo excluiría ECC, múltiples APC, etc.

La pregunta:

¿Qué considerar para comprar un servidor destinado a alojar 1 o 2 GPU de consumo?

Pasé mucho tiempo buscando en Internet y no pude obtener una comprensión básica de la pregunta; por ejemplo, a continuación se presentan algunas ideas que me vienen a la mente:

  • ¿Es una buena idea o incluso posible? Varios textos (páginas web) se quejan de la dificultad para que esos sistemas funcionen juntos, incompatibilidades, problemas con los controladores, etc.
  • ¿Cualquier chasis de servidor 2U-3U puede contener una tarjeta gráfica de 3 ranuras? ¿o dos?
  • Algunos servidores (por ejemplo, Gigabyte Gxxx) están especialmente diseñados para HPC con GPU. ¿Esto realmente aporta alguna diferencia en comparación con los servidores estándar (por ejemplo) HPE Proliant, IBM...?
  • ¿La mayoría de los servidores admiten PCI-express v4 x16, necesario para las tarjetas GPU de consumo?
  • ¿El flujo de aire en el gabinete del servidor es compatible con una tarjeta GPU de consumo (generalmente 3 ventilaciones en la parte inferior)?
  • ¿Algún problema con las conexiones eléctricas?

Respuesta1

Usamos muchas GPU en nuestros servidores, pero hay una única regla a seguir;

Utilice únicamente piezas admitidas explícitamente por el fabricante para su modelo exacto de servidor.

No rompas esta regla.

información relacionada