檢查 NVIDIA 顯示卡是否因 PSU 功率不足而崩潰

檢查 NVIDIA 顯示卡是否因 PSU 功率不足而崩潰

我最近開始玩一些較新的遊戲,並遇到頻繁的、間歇性的崩潰列印錯誤,例如DXGI_ERROR_DEVICE_HUNGDXGI_ERROR_DEVICE_REMOVED或類似的錯誤。研究將問題歸結為以下可能性:

  • 顯示卡故障,
  • 電源功率不足。

我的問題是:我該如何區分兩者?是否有一些診斷程序可以記錄 NVIDIA 卡的「因功率不足而導致的故障」事件,或有類似效果?

此卡基於 NVIDIA GTX 6xx 系列晶片組,相關係統為 Windows 7 64 位元(與 Linux 雙重啟動,以防執行故障排除所需)。


筆記:

我故意省略了其餘的配置,因為我希望答案盡可能通用 - 為了社區的利益。如果您認為您有一個仍然足夠通用且絕對的解決方案需要更多信息,請發表評論。

降頻不是一個可行的解決方案(因為它不區分這兩種情況),根據卡片和 PSU 的規格,提供的瓦數應該足夠(儘管只有很小的開銷)。

為了完整起見,這裡是崩潰後卡片參數的圖表。每個標籤描述了其下面的圖表,最上面的圖表是攝氏溫度。 GPU 使用率的峰值和核心時脈頻率的下降對應於崩潰:

正常運行和崩潰期間的顯示卡統計信息

答案1

如果您使用無名 PSU,這可能是問題的根源。即使有時已知品牌 PSU 會出現這種情況,無名人士通常也會計算所有電源線(-5、-12、3.3、5、5VSB、12V)的總功率,其中真正使用的只有 +12V由圖形卡(如果有外部電源連接器)和CPU(帶有P4 連接器)。此外,3.3 和/或 5V 通常可提供高安培電流,而 +12V 則較低。 (已經見過+3.3V 上無用的 40A 和 +12V 上幾乎沒有 18A 的 PSU)雜牌 PSU 也可能具有尺寸過小的組件,導致它們無法正確提供超過 80% 的總瓦數。

了解計算機的所有硬體規格將有助於了解 PSU 是否足夠。

不過,您可以嘗試一件事:將 CPU 倍頻設為較低值,對其進行降壓,這樣消耗的電流會少一點,但這不會直接影響顯示卡。顯然,你在遊戲中的表現會降低。

您可以對晶片組進行相同的嘗試,但請確保 PCIe 鏈路頻率固定為 100Mhz。

最後,某些顯示卡擁有板載 LED,用於指示顯示卡無法正確供電。 (以我的 Sapphire Radeon HD4850 為例,但這裡我們討論的是 NVidia)

答案2

因此,由於未指定的“硬體故障”,該卡在保固期內更換。

總結一下,如果:

  • 您遇到了類似問題中的問題(間歇性卡斷電,沒有溫度峰值),
  • 您已確認您的 PSU 與您的顯示卡相比並沒有功率不足。

然後簡單地安排檢查是否當卡片插入完全不同的硬體配置時出現故障。當然,提供驗證的機器應該具有相同或更高的規格(尤其是 PSU 和主機板)。

最後,我就是這樣做的——讓朋友在他們的電腦上檢查這張卡。大約 7 分鐘後又出現了完全相同的故障。

當然,還有一個非常顯示卡可能發生故障而損壞主機板的可能性很小 - 但是,這種可能性不大,並且僅檢查其他配置上的顯示卡比其他方式更安全,因為您這裡只有一個可能有故障的組件在起作用。

相關內容