高性能コンピューティング用の GPU を購入したいと考えています。私の知る限り、Quadro GV100 と Tesla V100 の計算能力 TFLOP は非常に似ており、Quadro GV100 はさらに高いです。
しかし、明らかな違いがいくつかあり、Quadro GV100 には VR やグラフィックスなどの機能がより多く備わっているようです。しかし、「コンピュータ API」では、Quadro GV100 には openacc サポートがないことに気が付きました。
Quadro GV100 と tesla v100 のコアは同じ (つまり GV100) なのに、なぜ openacc が Quadro GV100 でサポートされないのか理解できません。Quadro GV100 と tesla V100 の間には重要な構造上の違いがあり、Quadro GV100 が openacc をサポートできないのでしょうか。Quadro GV100 の将来のドライバー アップデートで openacc がサポートされるようになるのでしょうか。openacc は GPU 計算にとって重要ですが、特に Vasp ソフトウェアのような第一原理計算に使用する必要がありますか。Quadro GV100 には多くの追加機能が追加されていることを考えると、高性能計算の場合、Quadro GV100 のパフォーマンスは本当に Tesla V100 と同じですか。
答え1
価格差が大きいため、V100 ではなく GV100 を購入しました (まとめ買いする場合は V100 の方が経済的ですが、少量の場合はその逆になると言われました)。
私はこれを材料科学に使用しており、VASP、LAMMPS、および自作コードで問題なく動作し、HPC クラスターの V100 搭載ノードと大きな違いがないことを確認しています。
カードを相互接続することで GPU アドレス指定可能なメモリを 2 倍にできる機能が最も重要であり、GV100 にはこの機能が搭載されていると思います。
この方程式では、CPU メモリと PCI の機能が非常に重要です。目的は、PCI 経由でシステム メモリから GPU メモリにデータを効率的に転送できるようにすることですが、特にコンシューマー レベルの CPU ではこれがあまり得意ではありません。