モチベーション:
まず第一に、私はコンピュータ サイエンス、ソフトウェア開発、サーバー Linux 管理の知識は多少ありますが、サーバー ハードウェアを調べたことはなく、まったくの「初心者」です。この質問が皆さんのほとんどにとって些細なことであれば申し訳ありません。
私は、非常に集中的な(単一ポイントの)コンピューティング ニーズを持つソフトウェアを開発しています。必要な TFlops に到達するために、OpenCL(2.1)フレームワークを選択し、CPU を主に GPU(Linux OS)の駆動に使用して、ハイエンドのコンシューマー AMD グラフィック カードでほとんどの計算を実行します。現在、これを複数のマシンに拡張することを検討しています。
これらのマシンの整理方法を検討すると、標準の (コンシューマー) ATX タワーは理想的ではないことがすぐに明らかになりました。各ブランドが独自のシャーシ形状を持っており、基本的に 19 インチのエンクロージャに簡単に便利に積み重ねることができず、冷却空気の流れが良く、APC を共有し、ケーブルを管理することはできません。
この目標を掲げて、サーバーを収納したラック キャビネットを探し始めたところ、次のことがわかりました。
- Instinct/Tesla のような HPC 向けに設計された GPU は、主にコンシューマー向け GPU よりも 1 桁高価ですが、これはコンシューマー向けデバイスでは「遅い」二重浮動小数点演算を実現するためです (また、その価格で企業に販売できるためです)。
- これらのGPUでもPCI-Expressスペーサーが必要です
- GPU 対応サーバーでは、最大 2 スロットのグラフィック カードのみが許可されます (現在のハイエンドのコンシューマー GPU は通常 3 スロットです)。
- 19 インチ キャビネット用に設計された ATX 3U または 4U シャーシを見つけました。しかし、これらをコンシューマー ハードウェアにマウントすると、ECC、複数の APC などが使用できなくなります。
質問:
1 個または 2 個のコンシューマーグレード GPU をホストするためのサーバーを購入する際に考慮すべきことは何ですか?
私はすでにインターネットで調べるのに多くの時間を費やしましたが、質問についての基本的な理解を得ることができませんでした。たとえば、私の頭に浮かんだアイデアは次のとおりです。
- それは良いアイデアでしょうか、あるいはそもそも可能なのでしょうか? いくつかのテキスト (Web ページ) では、これらのシステムを連携させることの難しさ、非互換性、ドライバーの問題などについて不満が述べられています。
- 2U-3U サーバー シャーシには、3 スロットのグラフィック カードを 1 枚、または 2 枚搭載できますか?
- 一部のサーバー (Gigabyte Gxxx など) は GPU を搭載した HPC 向けに特別に設計されていますが、これは標準の (たとえば) HPE Proliant、IBM などのサーバーと比べて本当に何か違いがあるのでしょうか?
- ほとんどのサーバーは、コンシューマーグレードの GPU カードに必要な PCI-express v4 x16 をサポートしていますか?
- サーバー筐体内の空気の流れは、コンシューマーグレードの GPU カードと互換性がありますか (通常、底部に 3 つの通気口があります)
- 電源接続に問題はありますか?
答え1
当社のサーバーでは多数の GPU を使用していますが、従うべきルールが 1 つあります。
製造元によってサーバー モデルに対して明示的にサポートされている部品のみを使用してください。
このルールを破らないでください。