OpenCL を使用して GPU 計算を行っていますが、カードの FLOPS を計算するのに苦労しています。私が使用している float の FLOPS の計算式は非常に簡単です。
frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU
問題は、特定のカードの理論上のピーク パフォーマンスを倍精度で計算する方法です。私のカードは GeForce GTX 580 です。
--ダニエル。
答え1
[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.
特にこのセイバートのコメント上記のスレッドでは、2/8 が方程式に現れる場所の詳細について詳しく説明されています。