Razer Core X eGPU가 Thinkpad + Lubuntu 18.04에서 작동하지 않음

Razer Core X eGPU가 Thinkpad + Lubuntu 18.04에서 작동하지 않음

방금 처음으로 eGPU가 있는 Razor Core X를 Thinkpad에 연결했습니다. 팬이 회전하지만 nvidia-smieGPU가 표시되지 않습니다.

어떡해?

답변1

먼저 확인하세요 dmesg | tail -n 200. 다음과 같이 표시될 수 있습니다.

[   74.959198] thunderbolt 0000:06:00.0: current switch config:
[   74.959201] thunderbolt 0000:06:00.0:  Switch: 8086:15da (Revision: 6, TB Version: 2)
[   74.959202] thunderbolt 0000:06:00.0:   Max Port Number: 11
[   74.959203] thunderbolt 0000:06:00.0:   Config:
[   74.959204] thunderbolt 0000:06:00.0:    Upstream Port Number: 1 Depth: 1 Route String: 0x3 Enabled: 1, PlugEventsDelay: 254ms
[   74.959205] thunderbolt 0000:06:00.0:    unknown1: 0x0 unknown4: 0x0
[   74.999560] thunderbolt 0000:06:00.0: 3: reading drom (length: 0x56)
[   75.301575] thunderbolt 0000:06:00.0: 3: uid: 0x1279cc9b0ba8400
[   75.301686] thunderbolt 0000:06:00.0:  Port 0: 8086:15d3 (Revision: 6, TB Version: 1, Type: Port (0x1))
[   75.301689] thunderbolt 0000:06:00.0:   Max hop id (in/out): 7/7
[   75.301692] thunderbolt 0000:06:00.0:   Max counters: 8
[   75.301694] thunderbolt 0000:06:00.0:   NFC Credits: 0x800000
[   75.302174] thunderbolt 0000:06:00.0:  Port 1: 8086:15d3 (Revision: 6, TB Version: 1, Type: Port (0x1))
[   75.302178] thunderbolt 0000:06:00.0:   Max hop id (in/out): 15/15
[   75.302180] thunderbolt 0000:06:00.0:   Max counters: 16
[   75.302183] thunderbolt 0000:06:00.0:   NFC Credits: 0x7800000
[   75.302681] thunderbolt 0000:06:00.0:  Port 2: 8086:15d3 (Revision: 6, TB Version: 1, Type: Port (0x1))
[   75.302683] thunderbolt 0000:06:00.0:   Max hop id (in/out): 15/15
[   75.302685] thunderbolt 0000:06:00.0:   Max counters: 16
[   75.302687] thunderbolt 0000:06:00.0:   NFC Credits: 0x0
[   75.302689] thunderbolt 0000:06:00.0: 3:3: disabled by eeprom
[   75.302691] thunderbolt 0000:06:00.0: 3:4: disabled by eeprom
[   75.302692] thunderbolt 0000:06:00.0: 3:5: disabled by eeprom
[   75.302806] thunderbolt 0000:06:00.0:  Port 6: 8086:15d3 (Revision: 6, TB Version: 1, Type: PCIe (0x100102))
[   75.302808] thunderbolt 0000:06:00.0:   Max hop id (in/out): 8/8
[   75.302809] thunderbolt 0000:06:00.0:   Max counters: 2
[   75.302811] thunderbolt 0000:06:00.0:   NFC Credits: 0x800000
[   75.302960] thunderbolt 0000:06:00.0:  Port 7: 8086:15d3 (Revision: 6, TB Version: 1, Type: PCIe (0x100101))
[   75.302962] thunderbolt 0000:06:00.0:   Max hop id (in/out): 8/8
[   75.302964] thunderbolt 0000:06:00.0:   Max counters: 2
[   75.302966] thunderbolt 0000:06:00.0:   NFC Credits: 0x800000
[   75.302967] thunderbolt 0000:06:00.0: 3:8: disabled by eeprom
[   75.302969] thunderbolt 0000:06:00.0: 3:9: disabled by eeprom
[   75.302971] thunderbolt 0000:06:00.0: 3:a: disabled by eeprom
[   75.302973] thunderbolt 0000:06:00.0: 3:b: disabled by eeprom

이는 권한/보안 문제를 암시합니다.

문제를 해결할 수 있도록 Thunderbolt 관리 도구를 설치해 보겠습니다.

sudo apt install thunderbolt-tools

이제 Thunderbolt가 도크를 인식하는지 확인해 보겠습니다.

root@mymachine:~# tbtadm devices
0-4 Razer Core X  non-authorized  not in ACL

그렇습니다!

이제 도크를 승인해 보겠습니다.

tbtadm approve 0-4

이는 다음을 보여줍니다.

Authorizing "/sys/bus/thunderbolt/devices/0-4"
Already in ACL
system:5 Input/output error

도크를 뽑았다가 다시 연결하고 다시 보면 다음이 dmesg표시됩니다.

[11187.232181] thunderbolt 0000:06:00.0: PCIe tunnel creation failed

그래서 우리는 Thunderbolt를 다시 살펴보겠습니다.

root@mymachine:~# tbtadm devices
0-4 Razer Core X  non-authorized  in ACL

그리고 실제로 도크가 연결되어 있음을 확인할 수 있습니다.

root@mymachine:~# tbtadm acl
0XXXXXb0-XXXX-XXXX-ffff-ffffffffffff  Razer Core X  connected

수동으로 인증을 시도해 보겠습니다.

root@mymachine:~# echo '1' > /sys/bus/thunderbolt/devices/0-4/authorized 
-bash: echo: write error: Input/output error

이 시점에서 나는 BIOS가 문제일지도 모른다고 의심했습니다. 따라서 다시 시작하고 BIOS 설정을 불러옵니다. "사용자 인증"에 있지만 핵적인 "보안 없음" 옵션을 사용해 보겠습니다(나중에 다시 잠그는 방법을 알아내는 것이 좋을 것 같습니다). BIOS Thunderbolt 설정

이 시점에서 머신을 다시 부팅하십시오.

GPU를 연결하기 전에 Nvidia 드라이버가 로드되어 있는지 확인하세요.

sudo modprobe nvidia-uvm

그리고 GPU를 찾으십시오.

nvidia-smi

성공!

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.87.00    Driver Version: 418.87.00    CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:3D:00.0 Off |                  N/A |
| 15%   36C    P0     1W / 250W |      0MiB / 10989MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

에 따르면이 문서BIOS 설정은 다음을 의미합니다.

  • 보안 없음: Thunderbolt 장치가 자동으로 연결되도록 허용합니다.
  • 사용자 인증: 사용자 인증 후 Thunderbolt 장치 연결을 허용합니다.
  • 보안 연결: 사용자가 승인한 저장된 키를 사용하여 Thunderbolt 장치를 연결할 수 있도록 허용합니다.
  • 디스플레이 포트 및 USB: 디스플레이 출력과 USB 장치만 연결하도록 허용합니다. Thunderbolt 장치 연결이 허용되지 않습니다.

관련 정보