我正在使用 OpenCL 進行一些 GPU 計算,但我很難計算我的卡的 FLOPS。我使用的浮點數 FLOPS 公式非常簡單:
frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU
問題是,如何以雙精度計算特定卡的理論峰值性能。我的顯示卡是 GeForce GTX 580。
——丹尼爾.
答案1
[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.
尤其這個塞伯特的評論上面的線程深入討論了 2/8 公式的細節。