Berechnung von doppelten FLOPS für GPU

Berechnung von doppelten FLOPS für GPU

Ich verwende OpenCL für einige GPU-Berechnungen und habe Schwierigkeiten, die FLOPS meiner Karte zu berechnen. Die Formel für FLOPS in Float, die ich verwende, ist ziemlich einfach:

frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU

Das Problem ist, wie ich die theoretische Spitzenleistung für eine bestimmte Karte mit doppelter Genauigkeit berechnen kann. Meine Karte ist die GeForce GTX 580.

--Daniel.

Antwort1

Aushttps://devtalk.nvidia.com/default/topic/495177/cuda-programming-and-performance/what-is-the-double-precision-flops-rating-of-the-gtx580-/ :

[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.

Besondersdieser Kommentar von Seibertim obigen Thread wird ausführlich auf die Details eingegangen, wo die 2/8 in die Gleichung kommt.

verwandte Informationen