Расчет двойных FLOPS для GPU

Расчет двойных FLOPS для GPU

Я использую OpenCL для некоторых вычислений GPU, и у меня возникли трудности с вычислением FLOPS моей карты. Формула для FLOPS в float, которую я использую, довольно проста:

frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU

Проблема в том, как я могу вычислить теоретическую пиковую производительность для конкретной карты в Double precision. Моя карта — GeForce GTX 580.

--Дэниел.

решение1

Отhttps://devtalk.nvidia.com/default/topic/495177/программирование-и-производительность-cuda/какой-рейтинг-flops-double-precision-для-gtx580-/ :

[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.

Особенноэтот комментарий сейбертав теме выше подробно рассматривается, как в уравнении появляется 2/8.

Связанный контент