![¿Quadro gv100 es adecuado para informática de alto rendimiento?](https://rvso.com/image/1601558/%C2%BFQuadro%20gv100%20es%20adecuado%20para%20inform%C3%A1tica%20de%20alto%20rendimiento%3F.png)
Quiero comprar una GPU para informática de alto rendimiento. Hasta donde yo sé, la potencia de cálculo Tflops de quadro GV100 y tesla V100 es muy similar, y Quadro GV100 es incluso mayor.
La especificación de quadro GV100:
La especificación de tesla v100:
Pero hay algunas diferencias obvias, parece que Quadro GV100 tiene más funciones, como VR y gráficos. Pero en las "API de computadora", noto que Quadro GV100 carece de soporte openacc.
No entiendo, dado que el núcleo de Quadro GV100 y tesla v100 es el mismo (es decir, GV100), ¿por qué Openacc no es compatible con Quadro GV100? ¿Existen diferencias estructurales importantes entre Quadro GV100 y tesla V100 de modo que Quadro GV100 no pueda admitir openacc? ¿Openacc puede ser compatible con futuras actualizaciones de controladores para Quadro GV100? ¿Openacc es importante para el cálculo de GPU, especialmente necesito usarlo para el cálculo del primer principio como el software vasp? ¿El rendimiento de Quadro GV100 es realmente el mismo que el de Tesla V100 para computación de alto rendimiento considerando que Quadro GV100 agrega muchas funcionalidades adicionales?
Respuesta1
Compré GV100 en lugar de V100 debido a una gran diferencia de precio (me dijeron que si los compras al por mayor, V100 es mucho más viable económicamente, pero viceversa en cantidades bajas).
Lo uso para ciencia de materiales y confirmo que funciona bien con VASP, LAMMPS y mis códigos de elaboración casera, sin diferencias significativas con los nodos equipados con V100 en el clúster HPC.
Creo que la capacidad de duplicar la memoria direccionable de la GPU interconectando las tarjetas es lo más importante y está presente en el GV100.
Tenga en cuenta que la memoria de la CPU y las capacidades PCI son muy importantes en esta ecuación. La idea es poder transferir datos desde la memoria del sistema a la memoria de la GPU a través de PCI de manera eficiente, y especialmente las CPU de nivel de consumidor no son muy buenas con eso.