Стоит ли использовать графические процессоры потребительского класса (high-end) на сервере?

Стоит ли использовать графические процессоры потребительского класса (high-end) на сервере?

Мотивация:

Во-первых, даже если у меня есть некоторые познания в области компьютерных наук, разработки ПО и администрирования серверного Linux, я никогда не разбирался в серверном оборудовании и являюсь полным "новичком" в этом. Извините, если этот вопрос покажется тривиальным для большинства из вас.

Я разрабатываю программное обеспечение с довольно интенсивными (одноточечными) вычислительными потребностями, чтобы достичь требуемых TFlops, я выбрал фреймворк OpenCL (2.1) и выполняю большую часть вычислений на высокопроизводительной потребительской видеокарте AMD, используя CPU в основном для управления GPU (ОС Linux). Теперь я ищу возможность расширить это на несколько машин.

При рассмотрении вопроса о том, как организовать эти машины, быстро стало очевидно, что стандартные (потребительские) корпуса ATX Tower не идеальны: каждый бренд предлагает собственную форму корпуса, их по сути невозможно легко и удобно разместить в 19-дюймовом корпусе с хорошим потоком охлаждающего воздуха, общим APC, управлением кабелями и т. д.

С этой целью я начал искать стоечный шкаф с серверами и обнаружил, что:

  • Графические процессоры, разработанные для HPC, такие как Instinct/Tesla, стоят на порядок дороже потребительских графических процессоров, в основном из-за поддержки двойной обработки с плавающей запятой, которая «медленна» на потребительских устройствах (и потому, что по этой цене их можно продавать предприятиям).
  • Даже с этими графическими процессорами необходима проставка PCI-Express.
  • Серверы с поддержкой графических процессоров позволяют использовать графические карты только с двумя слотами (современные высокопроизводительные потребительские графические процессоры обычно имеют три слота).
  • Я нашел шасси ATX 3U или 4U, предназначенные для 19-дюймовых шкафов. Но эй! монтаж одного из них с потребительским оборудованием исключит ECC, несколько APC и т. д.

Вопрос:

Что следует учитывать при покупке сервера, предназначенного для размещения 1 или 2 графических процессоров потребительского уровня?

Я уже потратил много времени на изучение интернета, но не смог получить базового понимания вопроса. Например, вот несколько идей, которые приходят мне в голову:

  • Хорошая ли это идея или вообще возможно ли это? Несколько текстов (веб-страниц) жалуются на трудности в совместной работе этих систем, несовместимости, проблемы с драйверами и т. д.
  • Любой серверный корпус 2U-3U может вместить трехслотовую графическую карту? Или две?
  • Некоторые серверы (например, Gigabyte Gxxx) специально разработаны для HPC с графическими процессорами. Действительно ли это имеет какое-либо значение по сравнению со стандартными (например) серверами HPE Proliant, IBM...?
  • Поддерживают ли большинство серверов PCI-express v4 x16, необходимый для графических карт потребительского уровня?
  • Совместим ли воздушный поток в корпусе сервера с графической картой потребительского уровня (обычно 3 вентиляционных отверстия снизу)?
  • Возникли проблемы с подключением к электросети?

решение1

Мы используем множество графических процессоров на наших серверах, но есть одно правило, которому нужно следовать;

Используйте только те детали, которые производитель явно поддерживает именно для вашей модели сервера.

Не нарушайте это правило.

Связанный контент