![Ist Quadro GV100 für Hochleistungsrechnen geeignet?](https://rvso.com/image/1601558/Ist%20Quadro%20GV100%20f%C3%BCr%20Hochleistungsrechnen%20geeignet%3F.png)
Ich möchte eine GPU für Hochleistungsrechnen kaufen. Soweit ich weiß, ist die Rechenleistung (Tflops) von Quadro GV100 und Tesla V100 sehr ähnlich, und die von Quadro GV100 ist sogar noch höher.
Die Spezifikation der Quadro GV100:
Die Spezifikation des Tesla V100:
Es gibt jedoch einige offensichtliche Unterschiede. So scheint die Quadro GV100 mehr Funktionen zu haben, wie etwa VR und Grafik. Aber bei den „Computer-APIs“ stelle ich fest, dass die Quadro GV100 keine OpenACC-Unterstützung bietet.
Ich verstehe nicht, warum OpenACC nicht von Quadro GV100 unterstützt wird, da der Kern von Quadro GV100 und Tesla V100 derselbe ist (also GV100). Gibt es wichtige Strukturunterschiede zwischen Quadro GV100 und Tesla V100, sodass Quadro GV100 OpenACC nicht unterstützen kann? Kann OpenACC durch zukünftige Treiberupdates für Quadro GV100 unterstützt werden? Ist OpenACC wichtig für GPU-Berechnungen, insbesondere muss ich es für First-Principle-Berechnungen wie Vasp-Software verwenden? Ist die Leistung von Quadro GV100 bei Hochleistungsberechnungen wirklich dieselbe wie die von Tesla V100, wenn man bedenkt, dass Quadro GV100 viele zusätzliche Funktionen bietet?
Antwort1
Ich habe GV100 statt V100 gekauft, da der Preisunterschied zu groß war (mir wurde gesagt, dass V100 bei Großbestellungen wirtschaftlicher sei, bei kleineren Mengen jedoch umgekehrt).
Ich verwende es für die Materialwissenschaft und kann bestätigen, dass es mit VASP, LAMMPS und meinen selbst erstellten Codes gut funktioniert und dass es bei mit V100 ausgestatteten Knoten im HPC-Cluster keinen nennenswerten Unterschied gibt.
Ich denke, das Wichtigste ist die Möglichkeit, den adressierbaren GPU-Speicher durch die Verbindung der Karten zu verdoppeln, und diese Möglichkeit ist beim GV100 vorhanden.
Bitte beachten Sie, dass CPU-Speicher und PCI-Fähigkeiten in dieser Gleichung eine große Rolle spielen. Die Idee besteht darin, Daten effizient über PCI vom Systemspeicher zum GPU-Speicher übertragen zu können, und insbesondere CPUs auf Verbraucherebene sind darin nicht besonders gut.