如何啟用停用的串流處理器（SM）？

Question

為了：

我不確定我是否真的只有 2 個短信，或者我的某些短信已被禁用

你的GPU是GK107。它有兩個 SMX，每個都有 192 SP。沒有禁用的處理器。
可能[原文如此]有某種方法可以啟用更多SM，然後每個SM的SP數量將會減少。

沒有什麼神奇的方法可以改變軟體中的晶片。
我仍然感到困惑的是，具有超過2 個SM（假設有8 個SM）但每個SM 的SP 數量較少（384/8 = 每個SM 48 個SP）的GPU 與具有2 個SM 和每個SM 192 個SP 的GPU 的效能相同嗎？

這是一個很大的問題，我不會在這裡嘗試回答。 NVIDIA 發布了許多非常詳細的白皮書，介紹其各代旗艦運算卡的架構和效能。如果您願意，我建議您自己閱讀它們。話雖如此，經驗法則是在同一代架構內設備擁有的 SM 或 SMX 越多，它在算術限制運算中的表現就越好。比較不同世代的 GPU 是徒勞無功的。例如，NVIDIA 發布的第一款 Telsa 計算卡有 16 個 SM（C860）。最近的有 15 個 SMX（K40）。它們的峰值單精度性能大約相差 10 倍。另請注意，許多現實世界的應用程式都受到記憶體頻寬的限制，這可以從根本上改變不同卡之間的效能差異。雖然核心數量和峰值 FLOP 或多或少遵循摩爾定律，但記憶體頻寬卻沒有。

Answer 1

為了：

我不確定我是否真的只有 2 個短信，或者我的某些短信已被禁用

你的GPU是GK107。它有兩個 SMX，每個都有 192 SP。沒有禁用的處理器。
可能[原文如此]有某種方法可以啟用更多SM，然後每個SM的SP數量將會減少。

沒有什麼神奇的方法可以改變軟體中的晶片。
我仍然感到困惑的是，具有超過2 個SM（假設有8 個SM）但每個SM 的SP 數量較少（384/8 = 每個SM 48 個SP）的GPU 與具有2 個SM 和每個SM 192 個SP 的GPU 的效能相同嗎？

這是一個很大的問題，我不會在這裡嘗試回答。 NVIDIA 發布了許多非常詳細的白皮書，介紹其各代旗艦運算卡的架構和效能。如果您願意，我建議您自己閱讀它們。話雖如此，經驗法則是在同一代架構內設備擁有的 SM 或 SMX 越多，它在算術限制運算中的表現就越好。比較不同世代的 GPU 是徒勞無功的。例如，NVIDIA 發布的第一款 Telsa 計算卡有 16 個 SM（C860）。最近的有 15 個 SMX（K40）。它們的峰值單精度性能大約相差 10 倍。另請注意，許多現實世界的應用程式都受到記憶體頻寬的限制，這可以從根本上改變不同卡之間的效能差異。雖然核心數量和峰值 FLOP 或多或少遵循摩爾定律，但記憶體頻寬卻沒有。

相關內容