Я использую OpenCL для некоторых вычислений GPU, и у меня возникли трудности с вычислением FLOPS моей карты. Формула для FLOPS в float, которую я использую, довольно проста:
frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU
Проблема в том, как я могу вычислить теоретическую пиковую производительность для конкретной карты в Double precision. Моя карта — GeForce GTX 580.
--Дэниел.
решение1
[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.
Особенноэтот комментарий сейбертав теме выше подробно рассматривается, как в уравнении появляется 2/8.