
我在某處發現視訊記憶體頻寬是顯示卡效能的一個很好的指標。我檢查了幾個例子,它與基準點有很好的相關性。
我在另一篇文章中讀到GPU只能使用顯存,如果CPU想讓GPU為它計算一些東西,就應該將RAM的內容複製到顯存。
這種副本經常發生嗎?這是否意味著CPU的記憶體頻寬應該以某種方式與顯示卡的頻寬相匹配,否則CPU會限制GPU的效能?
答案1
這是一個相對容易測試的假設。有3個數字值得一看:
- CPU 到記憶體頻寬
- PCIe 頻寬(CPU 到 GPU)
- GPU頻寬
CPU 頻寬數據可以在製造商網站上找到,PCIe x16 頻寬是已知數據,GPU 製造商也會發布這些數據。
所以對於高端i7-8700與 x16PCIe3.0 連結和英偉達 1080數字如下
- 48GB/s(CPU 到記憶體)
- ~16GB/s(PCIe 頻寬(CPU 到 GPU))
- 320GB/秒(GPU 頻寬)
因此,雖然 CPU 與其本地內存有相對較好的頻寬,並且 GPU 與其內存有大量鏈接,但兩個設備之間的鏈接似乎是有限的。
對於遊戲來說,這並不是真正的問題,遊戲只需向 GPU 加載紋理和場景數據,之後頻寬要求就相對較小。
對於 GPGPU 任務,CPU 和 GPU 之間的有限頻寬連結是否有問題完全取決於您的資料。
答案是,這取決於您使用 GPU 做什麼。
答案2
有兩種視訊卡,它們的記憶體使用情況各不相同。
融合的
整合 GPU 不使用自己的 RAM;它使用系統的記憶體。坦白說,它的主要優點是便宜。整合式顯示卡屬於低階顯示卡,因此在玩 3D 遊戲時您可能需要調低顯示卡設定。
投入的
專用或離散 GPU 擁有自己獨立的視訊記憶體來源,使系統使用的 RAM 保持不變。此記憶體與電腦的系統記憶體完全分開。專用卡適用於嚴肅的遊戲或專業的平面設計師。
結論
對於整合GPU來說,只有一個內存,因此不需要複製。對於專用GPU來說,兩個記憶體之間沒有連接,因此頻寬不需要匹配,並且仍然沒有副本。