為什麼 Geforce 卡的雙精度效能比 Tesla 卡慢 4 倍？

Question

這是在硬體中實現雙精度運算與必須將雙精度運算作為四個單精度運算執行之間的差異。

例如，考慮將“16”乘以“43”。如果您有一個原生的雙位數乘法器，您只需一次操作即可完成。如果您只有個位數的乘數，則需要將 1 乘以 4、1 乘以 3、6 乘以 4 以及 6 乘以 3。像這樣：

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

請注意，您需要執行以下操作4一位數乘法執行一次兩位數乘法，因此需要四倍的時間。因此，如果您沒有雙精確度乘法器而只有單精確度乘法器，則執行雙精確度乘法需要四倍的時間。

Answer 1

這是在硬體中實現雙精度運算與必須將雙精度運算作為四個單精度運算執行之間的差異。

例如，考慮將“16”乘以“43”。如果您有一個原生的雙位數乘法器，您只需一次操作即可完成。如果您只有個位數的乘數，則需要將 1 乘以 4、1 乘以 3、6 乘以 4 以及 6 乘以 3。像這樣：

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

請注意，您需要執行以下操作4一位數乘法執行一次兩位數乘法，因此需要四倍的時間。因此，如果您沒有雙精確度乘法器而只有單精確度乘法器，則執行雙精確度乘法需要四倍的時間。

相關內容