サーバーには ECC RAM 対応 GPU が必要ですか、それとも通常の GPU でもサーバーで問題なく動作しますか?

サーバーには ECC RAM 対応 GPU が必要ですか、それとも通常の GPU でもサーバーで問題なく動作しますか?

通常の CPU RAM は ECC ですが、サーバーでは GPU で ECC RAM を使用する必要がありますか? Quadro k6000 または AMD Firepro を使用する代わりに、可能であれば GTX 980 または AMD r9 290 を使用できると思います... また、ECC RAM を使用する必要がない場合は、「サーバー」 GPU はありますか (i7 プロセッサはサーバー E7 に「似ています」... E7 は一般にサーバー/ワークステーション用で、i7 は一般にデスクトップ用です)... 助けてください!!!

答え1

サーバーでデスクトップ カードを使用する場合の最大の問題は、メモリ (これは重要ではありません) ではなく、スペースと電力です。

サーバー カードは通常は小型で、デスクトップ カードに搭載されているような 2 ~ 3 スロットの巨大なヒートシンクやファンはありません。

また、通常は追加の電源ケーブルも必要ありません。ほとんどのサーバーには 6 ピンまたは 8 ピンのビデオ カード電源コネクタがありません (一部のサーバーにはある場合や、ハッキングで取り付けることができる場合もあります)。

熱も問題です。小型のラックマウント システムでは、1 インチのファンで除去できる熱には限界があります。

そして最後にドライバーです。一部のデスクトップ カードには、サーバー オペレーティング システム用の適切なドライバーがありません。同等のクライアント OS ドライバーを使用できる場合もあれば、使用できない場合もあります。

もう 1 つの違いは、さまざまなタスクでカードがどのように機能するかです。デスクトップ カードはゲーム用に設計されています。サーバー カードとワークステーション カードは通常、ターミナル サーバーの GPU アクセラレーションや AutoCAD レンダリングなどの 2D パフォーマンスに優れています。また、安定性が高く、コストもかなり高くなります。

デスクトップ カードがサーバーに適合し、適切な電源接続があり、過熱せず、必要な種類のパフォーマンスを提供する場合は、そのカードを選択してください。

答え2

GPU ECC RAM はどのサーバーにも厳密な要件ではありません。ECC システム RAM の使用と相関関係はありません。

それでも、状況によっては、ECC メモリを備えた GPU が強く推奨されます。基本的に、高精度の GPU コンピューティング タスク (倍精度の Folding@Home など) に GPU を使用する場合は、ECC VRAM が必要です。ECC VRAM がコンピューティング グレードのビデオ カード (例: tesla K10、Titan) に多く搭載されているのに対し、同等のゲーム向け製品では通常の非 ECC RAM が使用されているのは偶然ではありません。

CAD/CAM やポストプロセス レンダリングに使用する場合、ECC RAM は追加すると便利ですが、絶対に必要なわけではありません。ゲームの場合、ECC VRAM はほとんど役に立ちません。

Quadros と一般消費者向けビデオ カードの本当の違いは、ECC メモリではなく、前者にインストールできるドライバーです。CAD/CAM/3D モデリングでは、複雑なワイヤーフレーム モデルの操作が必要で、ジオメトリ エンジンとライン アンチエイリアシング機能が限界まで押し上げられます (テクスチャリング、フィルレート、フル スクリーン アンチエイリアシングが重視されるゲームとは対照的です)。適切なドライバーを備えた適切なカード (例: ローエンドまたはミッドエンドの Quadro) は、ハイエンドの一般消費者向けカードよりも 2 倍または 3 倍のパフォーマンスを発揮できます。ここでいくつかの例を見つけることができます。

答え3

RAM は関係ありません。最大の問題は、最近のコンシューマー向け GPU は意図的に電源ケーブルが入らないように作られていることです (背面から側面に移動されています)。

データセンターでは消費者向けGPUを使用できない

ワークステーション/サーバー カードでバグを修正する一方で、GTX/RTX ドライバーの既知のバグを意図的に残すことがあります。もちろん、コストは 5 倍かかります。

NV は EULA にさまざまな法的制限を設け、データ センターでこのようなカードを使用することを明示的に禁止しています。したがって、確かに、データ センターで消費者向け GPU を使用することは可能ですが、多くの問題に直面することになります。

答え4

2023-02-21: Passmark の MemTest86 ツールドキュメンテーションECC に関する優れた情報があります。


ECC メモリは、宇宙線などによるランダムなビット反転からユーザーを保護することを目的としています。

Googleは勉強そして次のように結論付けた。

弊社のマシンの約 3 分の 1 と DIMM の 8% 以上で、1 年に少なくとも 1 つの修正可能なエラーが発生しています。DIMM あたりの修正可能なエラーの数は非常に変動が大きく、一部の DIMM では他の DIMM に比べて膨大な数のエラーが発生します。

確かにこの調査はシステム RAM に関するもので、VRAM に関するものではありませんが、破損が発生する可能性はあります。しかし、私見ではその可能性は低く、そのためにバックアップがあると思います :-)。

GPU を購入する際に、同じ GPU シリーズ (たとえば 3000 シリーズ) 内で考慮すべき他の重要な要素があると思います。VRAM の量、物理的なサイズ、冷却/ノイズ、電力、nvLink サポートなどです。

たとえば、私は 12GB ECC VRAM 搭載の RTX A2000 と 12GB NON-ECC VRAM 搭載の Asus ROG Strix RTX 3060 を持っています。3060 は Gaming と Studio の両方の nVIDIA ドライバーを使用でき、より高速で、より低温で動作し、同じ量の VRAM を持ち、より静かです。確かに 3 つのスロットを占有して大きく、より多くの電力を消費し、nvLink を使用できませんが、ケースにはスペースがあり、必要な GPU は 1 つだけで、電力は大したことはなく、ビット フリップで運試しをします。

結局のところ、コンピューターのほとんどのものと同様に、これは単なるトレードオフです。

ワークステーション GPU に関する私の主な問題は、うるさい送風ファンの騒音です。そのため、十分な VRAM が得られる限り、騒音を抑えるためにいくつかのものを諦めるつもりです。

関連情報