Подходит ли quadro gv100 для высокопроизводительных вычислений?

Подходит ли quadro gv100 для высокопроизводительных вычислений?

Хочу купить GPU для высокопроизводительных вычислений. Насколько мне известно, вычислительная мощность Tflops у Quadro GV100 и Tesla V100 очень и очень похожа, а у Quadro GV100 она даже выше.

Технические характеристики Quadro GV100: введите описание изображения здесь

Спецификация tesla v100: введите описание изображения здесь

Но есть некоторые очевидные различия, кажется, что Quadro GV100 имеет больше функций, таких как VR, графика. Но в "компьютерных API" я заметил, что Quadro GV100 не хватает поддержки OpenACC.

Я не понимаю, поскольку ядро ​​Quadro GV100 и Tesla V100 одинаковое (то есть GV100), почему OpenACC не поддерживается Quadro GV100? Существуют ли важные структурные различия между Quadro GV100 и Tesla V100, из-за которых Quadro GV100 не может поддерживать OpenACC? Может ли OpenACC поддерживаться будущим обновлением драйвера для Quadro GV100? Важен ли OpenACC для вычислений на GPU, особенно мне нужно использовать его для вычислений на основе первых принципов, таких как программное обеспечение vasp? Действительно ли производительность Quadro GV100 такая же, как у Tesla V100 для высокопроизводительных вычислений, учитывая, что Quadro GV100 добавляет много дополнительных функций?

решение1

Я купил GV100 вместо V100 из-за огромной разницы в цене (мне сказали, что если покупать оптом, V100 гораздо экономически выгоднее, но в небольших количествах — наоборот).

Я использую его для материаловедения и подтверждаю, что он отлично работает с VASP, LAMMPS и моими домашними кодами, без существенной разницы с узлами, оснащенными V100, в кластере HPC.

Я думаю, что возможность удвоения адресуемой памяти графического процессора путем соединения карт является наиболее важной и присутствует в GV100.

Обратите внимание, что в этом уравнении большое значение имеют память ЦП и возможности PCI. Идея заключается в том, чтобы иметь возможность эффективно передавать данные из системной памяти в память ГП через PCI, а ЦП потребительского уровня с этим не очень-то справляются.

Связанный контент