Quadro GV100 は高性能コンピューティングに適していますか?

Quadro GV100 は高性能コンピューティングに適していますか?

高性能コンピューティング用の GPU を購入したいと考えています。私の知る限り、Quadro GV100 と Tesla V100 の計算能力 TFLOP は非常に似ており、Quadro GV100 はさらに高いです。

quadro GV100の仕様: ここに画像の説明を入力してください

テスラV100の仕様: ここに画像の説明を入力してください

しかし、明らかな違いがいくつかあり、Quadro GV100 には VR やグラフィックスなどの機能がより多く備わっているようです。しかし、「コンピュータ API」では、Quadro GV100 には openacc サポートがないことに気が付きました。

Quadro GV100 と tesla v100 のコアは同じ (つまり GV100) なのに、なぜ openacc が Quadro GV100 でサポートされないのか理解できません。Quadro GV100 と tesla V100 の間には重要な構造上の違いがあり、Quadro GV100 が openacc をサポートできないのでしょうか。Quadro GV100 の将来のドライバー アップデートで openacc がサポートされるようになるのでしょうか。openacc は GPU 計算にとって重要ですが、特に Vasp ソフトウェアのような第一原理計算に使用する必要がありますか。Quadro GV100 には多くの追加機能が追加されていることを考えると、高性能計算の場合、Quadro GV100 のパフォーマンスは本当に Tesla V100 と同じですか。

答え1

価格差が大きいため、V100 ではなく GV100 を購入しました (まとめ買いする場合は V100 の方が経済的ですが、少量の場合はその逆になると言われました)。

私はこれを材料科学に使用しており、VASP、LAMMPS、および自作コードで問題なく動作し、HPC クラスターの V100 搭載ノードと大きな違いがないことを確認しています。

カードを相互接続することで GPU アドレス指定可能なメモリを 2 倍にできる機能が最も重要であり、GV100 にはこの機能が搭載されていると思います。

この方程式では、CPU メモリと PCI の機能が非常に重要です。目的は、PCI 経由でシステム メモリから GPU メモリにデータを効率的に転送できるようにすることですが、特にコンシューマー レベルの CPU ではこれがあまり得意ではありません。

関連情報