為什麼 Geforce 卡的雙精度效能比 Tesla 卡慢 4 倍?

為什麼 Geforce 卡的雙精度效能比 Tesla 卡慢 4 倍?

我在很多地方都看過提到這一點。來自維基百科:

對於同等的單精度輸出,基於 Fermi 的 nVidia Geforce 卡的雙精度性能[比 Tesla 卡]低四倍。

我聽過涉及「乘數」的含糊解釋。它是否涉及相當於 Geforce 死亡的身體殘疾?

答案1

這是在硬體中實現雙精度運算與必須將雙精度運算作為四個單精度運算執行之間的差異。

例如,考慮將“16”乘以“43”。如果您有一個原生的雙位數乘法器,您只需一次操作即可完成。如果您只有個位數的乘數,則需要將 1 乘以 4、1 乘以 3、6 乘以 4 以及 6 乘以 3。像這樣:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

請注意,您需要執行以下操作4一位數乘法執行一次兩位數乘法,因此需要四倍的時間。因此,如果您沒有雙精確度乘法器而只有單精確度乘法器,則執行雙精確度乘法需要四倍的時間。

相關內容