cuda v100 和 RTX2080 頻寬波動

cuda v100 和 RTX2080 頻寬波動

我有一個簡單的 cuda 內核(添加兩個大小為 N 的向量)非常類似於到這個cuda博客這裡。我只改變了一些事情,例如對各種樣本進行測量。因此,假設運行 1000 次,然後將此測量值寫入 txt。如果我現在繪製將向量傳輸到設備的測量結果,我會得到以下結果:

在此輸入影像描述

現在,如果我們看一下繪製為垂直誤差條的 stddev,那麼應該很清楚,由於某種原因,資料移動波動隨大小變化,因為誤差條在雙對數圖中有點恆定。當僅繪製 stddev 時可以驗證這一點

在此輸入影像描述

如果我從CUDA博客,然後我每跑 10 次左右也會得到頻寬波動。這是從哪裡來的?我在兩個不同的 GPU(V100 和 RTX2080)上觀察到相同的行為。對於圖像方面給您帶來的不便,我們深表歉意,但我沒有足夠的聲譽點。

答案1

作為一個nvidia 開發論壇使用者建議我嘗試了固定內存而不是非固定內存,效果很好。波動幾乎完全消失了。

相關內容