計算 GPU 的雙 FLOPS

計算 GPU 的雙 FLOPS

我正在使用 OpenCL 進行一些 GPU 計算,但我很難計算我的卡的 FLOPS。我使用的浮點數 FLOPS 公式非常簡單:

frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU

問題是,如何以雙精度計算特定卡的理論峰值性能。我的顯示卡是 GeForce GTX 580。

——丹尼爾.

答案1

https://devtalk.nvidia.com/default/topic/495177/cuda-programming-and-performance/what-is-the-double- precision-flops- rating-of-the-gtx580-/ :

[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.

尤其這個塞伯特的評論上面的線程深入討論了 2/8 公式的細節。

相關內容