Мотивация:
Во-первых, даже если у меня есть некоторые познания в области компьютерных наук, разработки ПО и администрирования серверного Linux, я никогда не разбирался в серверном оборудовании и являюсь полным "новичком" в этом. Извините, если этот вопрос покажется тривиальным для большинства из вас.
Я разрабатываю программное обеспечение с довольно интенсивными (одноточечными) вычислительными потребностями, чтобы достичь требуемых TFlops, я выбрал фреймворк OpenCL (2.1) и выполняю большую часть вычислений на высокопроизводительной потребительской видеокарте AMD, используя CPU в основном для управления GPU (ОС Linux). Теперь я ищу возможность расширить это на несколько машин.
При рассмотрении вопроса о том, как организовать эти машины, быстро стало очевидно, что стандартные (потребительские) корпуса ATX Tower не идеальны: каждый бренд предлагает собственную форму корпуса, их по сути невозможно легко и удобно разместить в 19-дюймовом корпусе с хорошим потоком охлаждающего воздуха, общим APC, управлением кабелями и т. д.
С этой целью я начал искать стоечный шкаф с серверами и обнаружил, что:
- Графические процессоры, разработанные для HPC, такие как Instinct/Tesla, стоят на порядок дороже потребительских графических процессоров, в основном из-за поддержки двойной обработки с плавающей запятой, которая «медленна» на потребительских устройствах (и потому, что по этой цене их можно продавать предприятиям).
- Даже с этими графическими процессорами необходима проставка PCI-Express.
- Серверы с поддержкой графических процессоров позволяют использовать графические карты только с двумя слотами (современные высокопроизводительные потребительские графические процессоры обычно имеют три слота).
- Я нашел шасси ATX 3U или 4U, предназначенные для 19-дюймовых шкафов. Но эй! монтаж одного из них с потребительским оборудованием исключит ECC, несколько APC и т. д.
Вопрос:
Что следует учитывать при покупке сервера, предназначенного для размещения 1 или 2 графических процессоров потребительского уровня?
Я уже потратил много времени на изучение интернета, но не смог получить базового понимания вопроса. Например, вот несколько идей, которые приходят мне в голову:
- Хорошая ли это идея или вообще возможно ли это? Несколько текстов (веб-страниц) жалуются на трудности в совместной работе этих систем, несовместимости, проблемы с драйверами и т. д.
- Любой серверный корпус 2U-3U может вместить трехслотовую графическую карту? Или две?
- Некоторые серверы (например, Gigabyte Gxxx) специально разработаны для HPC с графическими процессорами. Действительно ли это имеет какое-либо значение по сравнению со стандартными (например) серверами HPE Proliant, IBM...?
- Поддерживают ли большинство серверов PCI-express v4 x16, необходимый для графических карт потребительского уровня?
- Совместим ли воздушный поток в корпусе сервера с графической картой потребительского уровня (обычно 3 вентиляционных отверстия снизу)?
- Возникли проблемы с подключением к электросети?
решение1
Мы используем множество графических процессоров на наших серверах, но есть одно правило, которому нужно следовать;
Используйте только те детали, которые производитель явно поддерживает именно для вашей модели сервера.
Не нарушайте это правило.