預期的行為

Question 1

經過長時間的戰鬥，我實際上能夠主要根據以下評論解決我的問題：https://forums.developer.nvidia.com/t/nvidia-xconfig-doesnt-do-what-i-want-it-to-nor-does-nvidia-settings/107883/7

因此，我認為了解這一點至關重要，這xorg.conf在這種情況下無法幫助您。無論我做什麼，當我有xorg.conf.

對我有用的是：

刪除您可能嘗試過的所有 nvidia 內容： sudo apt --purge remove 'nvidia-*'
從 nvidia 網站下載最新的 Nvidia 驅動程式並使其可執行。
以恢復模式重新啟動（或不運行 ax 伺服器）並執行驅動程式安裝程序，即使它顯示您的系統上找不到 GPU
刪除/etc/X11/xorg.conf您可能擁有的任何內容
reboot通常情況下
nvidia-prime如果尚未安裝，請安裝
sudo prime-select nvidia
更新/usr/share/X11/xorg.conf.d/10-amdgpu.conf 替換驅動程式modesetting

Section "OutputClass"
        Identifier "AMDgpu"
        MatchDriver "amdgpu"
        Driver "modesetting"
EndSection

更新為類似：

Section "OutputClass"
    Identifier "nvidia"
    MatchDriver "nvidia-drm"
    Driver "nvidia"
    Option "AllowEmptyInitialConfiguration"
    ModulePath "/usr/lib/x86_64-linux-gnu/nvidia/xorg"
    Option "PrimaryGPU" "Yes"
    Option "AllowExternalGpus" "True"
EndSection

建立兩個文件並optimus.desktop包含：/etc/xdg/autostart//usr/share/gdm/greeter/autostart/

[Desktop Entry]
Type=Application
Name=Optimus
Exec=sh -c "xrandr --setprovideroutputsource modesetting 0; xrandr --auto"
NoDisplay=true
X-GNOME-Autostart-Phase=DisplayServer

（@generix 在那裡說， modesetting NVIDIA-0;但對我來說它從來沒有像那樣工作過。但它適用於modesetting 0;）

reboot
通過運行測試一切是否正常：__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia glxinfo | grep vendor 如果它不返回 nvidia 行，則情況不好在我的情況下，我得到：

server glx vendor string: NVIDIA Corporation
client glx vendor string: NVIDIA Corporation
OpenGL vendor string: NVIDIA Corporation

另一個檢查是運行nvidia-smi會至少列出一些進程。

我在外部顯示器上從 nvidia gpu 獲取訊號，正如我想要的:)

謝謝 ;）

Answer

經過長時間的戰鬥，我實際上能夠主要根據以下評論解決我的問題：https://forums.developer.nvidia.com/t/nvidia-xconfig-doesnt-do-what-i-want-it-to-nor-does-nvidia-settings/107883/7

因此，我認為了解這一點至關重要，這xorg.conf在這種情況下無法幫助您。無論我做什麼，當我有xorg.conf.

對我有用的是：

刪除您可能嘗試過的所有 nvidia 內容： sudo apt --purge remove 'nvidia-*'
從 nvidia 網站下載最新的 Nvidia 驅動程式並使其可執行。
以恢復模式重新啟動（或不運行 ax 伺服器）並執行驅動程式安裝程序，即使它顯示您的系統上找不到 GPU
刪除/etc/X11/xorg.conf您可能擁有的任何內容
reboot通常情況下
nvidia-prime如果尚未安裝，請安裝
sudo prime-select nvidia
更新/usr/share/X11/xorg.conf.d/10-amdgpu.conf 替換驅動程式modesetting

Section "OutputClass"
        Identifier "AMDgpu"
        MatchDriver "amdgpu"
        Driver "modesetting"
EndSection

更新為類似：

Section "OutputClass"
    Identifier "nvidia"
    MatchDriver "nvidia-drm"
    Driver "nvidia"
    Option "AllowEmptyInitialConfiguration"
    ModulePath "/usr/lib/x86_64-linux-gnu/nvidia/xorg"
    Option "PrimaryGPU" "Yes"
    Option "AllowExternalGpus" "True"
EndSection

建立兩個文件並optimus.desktop包含：/etc/xdg/autostart//usr/share/gdm/greeter/autostart/

[Desktop Entry]
Type=Application
Name=Optimus
Exec=sh -c "xrandr --setprovideroutputsource modesetting 0; xrandr --auto"
NoDisplay=true
X-GNOME-Autostart-Phase=DisplayServer

（@generix 在那裡說， modesetting NVIDIA-0;但對我來說它從來沒有像那樣工作過。但它適用於modesetting 0;）

reboot
通過運行測試一切是否正常：__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia glxinfo | grep vendor 如果它不返回 nvidia 行，則情況不好在我的情況下，我得到：

server glx vendor string: NVIDIA Corporation
client glx vendor string: NVIDIA Corporation
OpenGL vendor string: NVIDIA Corporation

另一個檢查是運行nvidia-smi會至少列出一些進程。

我在外部顯示器上從 nvidia gpu 獲取訊號，正如我想要的:)

謝謝 ;）

Question 2

還發現解決方案作者：@bluehipy 對於讓運行 Ubuntu 20.04 的 Acer Predator Helios 300 與外部顯示器配合使用以及正確安裝 NVIDIA/CUDA 堆疊以進行深度學習工作非常有幫助，因為它會造成問題。

我只是在考慮實際退回Acer Predator Helios 300 並查看帶有eGPU 的Dell XPS 13 是否可以在本地調試機器學習/數據科學模型並在雲端實際訓練時適用於“瘦客戶端”類型的工作流程時才發現此線程。

因此，如果其他人正在努力使他們的筆記型電腦正常工作，不妨對原始說明進行一些小調整？

先決條件：

sudo apt install gcc make mesa-utils mpich

安裝 NVIDIA 驅動程式

對我有用的是：

刪除您可能嘗試過的所有 nvidia 內容：sudo apt --purge remove nvidia-*
原始說明說下載最新的驅動程序，但您可能希望從最新的 CUDA 工具包所以當你安裝東西的時候檢查一下那是什麼。可以使用最新的 NVIDIA 驅動程式嗎？你需要檢查老司機最有可能匹配 CUDA 工具包驅動程式版本，例如，在執行這些指令時，匹配版本為 470.57.02 (NVIDIA-Linux-x86_64-470.57.02.run)。
以恢復模式重新啟動（或不運行 ax 伺服器）並運行驅動程式安裝程序，即使它說在您的系統上找不到 GPU（刪除到根目錄，例如cd ../home/username/Downloads和./NVIDIA-Linux-x86_64-470.74.run）
刪除/etc/X11/xorg.conf您可能擁有的任何內容
重新啟動（點擊eUbuntu 的 grub 選單並添加nomodeset在最後）
如果尚未安裝 nvidia-prime，請安裝
sudo prime-select nvidia
更新/usr/share/X11/xorg.conf.d/10-amdgpu.conf替換驅動程式modesetting

Section "OutputClass" 
    Identifier "AMDgpu" 
    MatchDriver "amdgpu" 
    Driver "modesetting"
EndSection

sudo gedit /usr/share/X11/xorg.conf.d/10-nvidia.conf使用以下內容建立 nvidia 設定檔 ( )：

Section "OutputClass" 
    Identifier "nvidia" 
    MatchDriver "nvidia-drm" 
    Driver "nvidia" 
    Option "AllowEmptyInitialConfiguration" 
    ModulePath "/usr/lib/x86_64-linux-gnu/nvidia/xorg" 
    Option "PrimaryGPU" "Yes" 
    Option "AllowExternalGpus" "True"
EndSection

10 建立兩個檔案並optimus.desktop包含：/etc/xdg/autostart//usr/share/gdm/greeter/autostart/

[Desktop Entry]
Type=Application
Name=Optimus
Exec=sh -c "xrandr --setprovideroutputsource modesetting 0; xrandr --auto"
NoDisplay=true
X-GNOME-Autostart-Phase=DisplayServer

修改grub這樣 nomodeset 每次都會存在： sudo gedit /etc/default/grub
重啟
通過運行測試一切是否正常：__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia glxinfo | grep vendor
檢查它nvidia-smi至少會列出一些進程。

| NVIDIA-SMI 470.57.02    Driver Version: 470.57.02    CUDA Version: 11.4     | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC 
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M.
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0  On |                  N/A
| N/A   42C    P8    14W /  N/A |    264MiB /  5946MiB |      1%      Default

安裝 CUDA 工具包

最新的 CUDA 工具包按照指示安裝時是cuda_11.4.2_470.57.02_linux.run這樣安裝的，無需重新安裝NVIDIA驅動程式

wget https://developer.download.nvidia.com/compute/cuda/11.4.2/local_installers/cuda_11.4.2_470.57.02_linux.run
sudo sh cuda_11.4.2_470.57.02_linux.run

CUDA工具包安裝

驗證 CUDA 安裝

看https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#install-samples

先決條件：（如果你想正確編譯所有範例）從:

sudo apt-get install g++ freeglut3-dev build-essential libx11-dev \
    libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev libfreeimage-dev

例如./deviceQuery返回：

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "NVIDIA GeForce RTX 3060 Laptop GPU"
  CUDA Driver Version / Runtime Version          11.4 / 11.4
  CUDA Capability Major/Minor version number:    8.6
  Total amount of global memory:                 5947 MBytes (6235422720 bytes)
  (030) Multiprocessors, (128) CUDA Cores/MP:    3840 CUDA Cores
  GPU Max Clock rate:                            1425 MHz (1.42 GHz)

...

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 11.4, CUDA Runtime Version = 11.4, NumDevs = 1
Result = PASS

cudnn安裝

請參閱來自的指南https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html

下載 cuDNN v8.2.4（2021 年 9 月 2 日），適用於 CUDA 11.4

-> 適用於 Linux (x86_64) 的 cuDNN 函式庫，例如cudnn-11.4-linux-x64-v8.2.4.15.tgz

Answer

還發現解決方案作者：@bluehipy 對於讓運行 Ubuntu 20.04 的 Acer Predator Helios 300 與外部顯示器配合使用以及正確安裝 NVIDIA/CUDA 堆疊以進行深度學習工作非常有幫助，因為它會造成問題。

我只是在考慮實際退回Acer Predator Helios 300 並查看帶有eGPU 的Dell XPS 13 是否可以在本地調試機器學習/數據科學模型並在雲端實際訓練時適用於“瘦客戶端”類型的工作流程時才發現此線程。

因此，如果其他人正在努力使他們的筆記型電腦正常工作，不妨對原始說明進行一些小調整？

先決條件：

sudo apt install gcc make mesa-utils mpich

安裝 NVIDIA 驅動程式

對我有用的是：

刪除您可能嘗試過的所有 nvidia 內容：sudo apt --purge remove nvidia-*
原始說明說下載最新的驅動程序，但您可能希望從最新的 CUDA 工具包所以當你安裝東西的時候檢查一下那是什麼。可以使用最新的 NVIDIA 驅動程式嗎？你需要檢查老司機最有可能匹配 CUDA 工具包驅動程式版本，例如，在執行這些指令時，匹配版本為 470.57.02 (NVIDIA-Linux-x86_64-470.57.02.run)。
以恢復模式重新啟動（或不運行 ax 伺服器）並運行驅動程式安裝程序，即使它說在您的系統上找不到 GPU（刪除到根目錄，例如cd ../home/username/Downloads和./NVIDIA-Linux-x86_64-470.74.run）
刪除/etc/X11/xorg.conf您可能擁有的任何內容
重新啟動（點擊eUbuntu 的 grub 選單並添加nomodeset在最後）
如果尚未安裝 nvidia-prime，請安裝
sudo prime-select nvidia
更新/usr/share/X11/xorg.conf.d/10-amdgpu.conf替換驅動程式modesetting

Section "OutputClass" 
    Identifier "AMDgpu" 
    MatchDriver "amdgpu" 
    Driver "modesetting"
EndSection

sudo gedit /usr/share/X11/xorg.conf.d/10-nvidia.conf使用以下內容建立 nvidia 設定檔 ( )：

Section "OutputClass" 
    Identifier "nvidia" 
    MatchDriver "nvidia-drm" 
    Driver "nvidia" 
    Option "AllowEmptyInitialConfiguration" 
    ModulePath "/usr/lib/x86_64-linux-gnu/nvidia/xorg" 
    Option "PrimaryGPU" "Yes" 
    Option "AllowExternalGpus" "True"
EndSection

10 建立兩個檔案並optimus.desktop包含：/etc/xdg/autostart//usr/share/gdm/greeter/autostart/

[Desktop Entry]
Type=Application
Name=Optimus
Exec=sh -c "xrandr --setprovideroutputsource modesetting 0; xrandr --auto"
NoDisplay=true
X-GNOME-Autostart-Phase=DisplayServer

修改grub這樣 nomodeset 每次都會存在： sudo gedit /etc/default/grub
重啟
通過運行測試一切是否正常：__NV_PRIME_RENDER_OFFLOAD=1 __GLX_VENDOR_LIBRARY_NAME=nvidia glxinfo | grep vendor
檢查它nvidia-smi至少會列出一些進程。

| NVIDIA-SMI 470.57.02    Driver Version: 470.57.02    CUDA Version: 11.4     | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC 
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M.
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0  On |                  N/A
| N/A   42C    P8    14W /  N/A |    264MiB /  5946MiB |      1%      Default

安裝 CUDA 工具包

最新的 CUDA 工具包按照指示安裝時是cuda_11.4.2_470.57.02_linux.run這樣安裝的，無需重新安裝NVIDIA驅動程式

wget https://developer.download.nvidia.com/compute/cuda/11.4.2/local_installers/cuda_11.4.2_470.57.02_linux.run
sudo sh cuda_11.4.2_470.57.02_linux.run

CUDA工具包安裝

驗證 CUDA 安裝

看https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#install-samples

先決條件：（如果你想正確編譯所有範例）從:

sudo apt-get install g++ freeglut3-dev build-essential libx11-dev \
    libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev libfreeimage-dev

例如./deviceQuery返回：

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "NVIDIA GeForce RTX 3060 Laptop GPU"
  CUDA Driver Version / Runtime Version          11.4 / 11.4
  CUDA Capability Major/Minor version number:    8.6
  Total amount of global memory:                 5947 MBytes (6235422720 bytes)
  (030) Multiprocessors, (128) CUDA Cores/MP:    3840 CUDA Cores
  GPU Max Clock rate:                            1425 MHz (1.42 GHz)

...

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 11.4, CUDA Runtime Version = 11.4, NumDevs = 1
Result = PASS

cudnn安裝

請參閱來自的指南https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html

下載 cuDNN v8.2.4（2021 年 9 月 2 日），適用於 CUDA 11.4

-> 適用於 Linux (x86_64) 的 cuDNN 函式庫，例如cudnn-11.4-linux-x64-v8.2.4.15.tgz

Question 3

我有一個類似的設置，一台運行 Ubuntu Mate 20.4 的 NUC，一台配備 NVidia RTX 2060 Super 的 Razor Core X。

基本上，我和你處於同一點，但沒有任何作用。然後我搞砸了一些事情，必須重新安裝 Ubuntu。不過，我是在插入 eGPU 機箱的情況下執行此操作的。

這時我發現了以下貼文：

https://egpu.io/forums/thunderbolt-linux-setup/ubuntu-19-04-easy-to-use-setup-script-for-your-egpu/

使用儲存庫中提供的腳本，我終於可以讓 GPU 運作了！我可以存取 CUDA，也可以使用兩個具有 eGPU 的外部顯示器。

我希望這個腳本也能幫助你。祝你好運。

Answer

我有一個類似的設置，一台運行 Ubuntu Mate 20.4 的 NUC，一台配備 NVidia RTX 2060 Super 的 Razor Core X。

基本上，我和你處於同一點，但沒有任何作用。然後我搞砸了一些事情，必須重新安裝 Ubuntu。不過，我是在插入 eGPU 機箱的情況下執行此操作的。

這時我發現了以下貼文：

https://egpu.io/forums/thunderbolt-linux-setup/ubuntu-19-04-easy-to-use-setup-script-for-your-egpu/

使用儲存庫中提供的腳本，我終於可以讓 GPU 運作了！我可以存取 CUDA，也可以使用兩個具有 eGPU 的外部顯示器。

我希望這個腳本也能幫助你。祝你好運。

預期的行為

預期的行為

實際行為

我嘗試過的

其他注意事項：

謝謝你！

更新

答案1

答案2

先決條件：

安裝 NVIDIA 驅動程式

安裝 CUDA 工具包

驗證 CUDA 安裝

cudnn安裝

答案3

相關內容