GPUのダブルFLOPSの計算

GPUのダブルFLOPSの計算

OpenCL を使用して GPU 計算を行っていますが、カードの FLOPS を計算するのに苦労しています。私が使用している float の FLOPS の計算式は非常に簡単です。

frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU

問題は、特定のカードの理論上のピーク パフォーマンスを倍精度で計算する方法です。私のカードは GeForce GTX 580 です。

--ダニエル。

答え1

からhttps://devtalk.nvidia.com/default/topic/495177/cuda-programming-and-performance/what-is-the-double-precision-flats-rating-of-the-gtx580-/ より :

[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.

特にこのセイバートのコメント上記のスレッドでは、2/8 が方程式に現れる場所の詳細について詳しく説明されています。

関連情報