Überlegungen zur Verwendung einer GPU der Consumer-Klasse (High-End) im Server?

Überlegungen zur Verwendung einer GPU der Consumer-Klasse (High-End) im Server?

Motivation:

Erstens, auch wenn ich einige Kenntnisse in Informatik, Softwareentwicklung und Server-Linux-Administration habe, habe ich mich noch nie mit Server-Hardware beschäftigt und bin ein absoluter „Neuling“ auf diesem Gebiet. Tut mir leid, wenn diese Frage für die meisten von Ihnen trivial ist.

Ich entwickle eine Software mit recht hohen Rechenanforderungen (Single Point). Um die erforderlichen TFlops zu erreichen, habe ich das OpenCL-Framework (2.1) ausgewählt und führe die meisten Berechnungen auf einer High-End-AMD-Grafikkarte für Endverbraucher durch, wobei die CPU hauptsächlich zum Ansteuern der GPU (Linux-Betriebssystem) verwendet wird. Ich möchte dies nun auf mehrere Maschinen ausweiten.

Bei der Frage, wie man diese Maschinen anordnen sollte, wurde schnell klar, dass standardmäßige (Consumer-)ATX-Tower nicht ideal sind: Jede Marke bringt ihre eigene Gehäuseform mit und sie lassen sich grundsätzlich nicht einfach und bequem in einem 19-Zoll-Gehäuse mit gutem Kühlluftstrom, gemeinsam genutztem APC, Kabelmanagement usw. stapeln.

Mit diesem Ziel begann ich, nach einem Rack-Schrank mit Servern zu suchen und fand Folgendes heraus:

  • Für HPC konzipierte GPUs wie Instinct/Tesla kosten um eine Größenordnung mehr als Consumer-GPUs, hauptsächlich, um die „langsame“ Doppel-Gleitkommazahl auf Consumer-Geräten zu ermöglichen (und weil sie zu diesem Preis an Unternehmen verkauft werden können).
  • Auch bei diesen GPUs ist ein PCI-Express-Abstandshalter erforderlich
  • GPU-fähige Server lassen nur Grafikkarten mit maximal 2 Steckplätzen zu (aktuelle High-End-GPUs für Verbraucher haben normalerweise 3 Steckplätze).
  • Ich habe ATX-3U- oder 4U-Gehäuse gefunden, die für 19-Zoll-Schränke ausgelegt sind. Aber hey! Die Montage eines dieser Gehäuse mit Verbraucherhardware würde ECC, mehrere APC usw. ausschließen.

Die Frage:

Was ist beim Kauf eines Servers zu beachten, der für das Hosten von 1 oder 2 GPUs der Verbraucherklasse vorgesehen ist?

Ich habe bereits viel Zeit mit der Suche im Internet verbracht und konnte zu der Frage kein grundlegendes Verständnis erlangen. Im Folgenden sind einige Ideen aufgeführt, die mir beispielsweise in den Sinn kommen:

  • Ist das eine gute Idee oder überhaupt möglich? In mehreren Texten (Webseiten) wird darüber geklagt, wie schwierig es ist, diese Systeme zusammenarbeiten zu lassen, dass es Inkompatibilitäten, Treiberprobleme usw. gibt.
  • Kann jedes 2U-3U-Servergehäuse eine Grafikkarte mit 3 Steckplätzen aufnehmen? Oder zwei?
  • Einige Server (z. B. Gigabyte Gxxx) sind speziell für HPC mit GPUs konzipiert. Macht das wirklich einen Unterschied im Vergleich zu Standardservern (z. B.) HPE Proliant, IBM...?
  • Unterstützen die meisten Server PCI-Express v4 x16, das für GPU-Karten im Verbrauchersegment erforderlich ist?
  • Ist der Luftstrom im Servergehäuse mit einer GPU-Karte der Verbraucherklasse kompatibel (normalerweise 3 Belüftungsöffnungen an der Unterseite)
  • Gibt es Probleme mit den Stromanschlüssen?

Antwort1

Wir verwenden viele GPUs in unseren Servern – aber es gibt eine Regel, die wir befolgen müssen;

Verwenden Sie nur Teile, die vom Hersteller ausdrücklich für Ihr genaues Servermodell unterstützt werden.

Verstoßen Sie nicht gegen diese Regel.

verwandte Informationen