Aspire A715-41G 노트북의 amd igpu 및 nvidia GPU 관련 비디오 문제

Aspire A715-41G 노트북의 amd igpu 및 nvidia GPU 관련 비디오 문제

업데이트:커널 메인라인 5.6.19-050619-generic을 설치하여 지금까지 해결된 안정성 문제

ubuntu 20.04 리포지토리에서 커널 버전 5.6을 언제 사용할 수 있습니까? ++++++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++++++++++++++

최근에 Acer Aspire 7 노트북 모델 A715-41G(정확한 모델: A715-41G-R8MJ)를 구입했는데 비디오를 올바르게 설정하는 데 문제가 있었습니다.

이 노트북에는 AMD Ryzen 5 3550H 프로세서와 개별 Nvidia Geforce gtx 1650 그래픽 카드(Radeon Vega Mobile Gfx가 탑재된 AMD Ryzen 5 3550H)가 함께 제공됩니다.

System:    Kernel: 5.4.0-42-generic x86_64 bits: 64 compiler: gcc v: 9.3.0 
           parameters: BOOT_IMAGE=/vmlinuz-5.4.0-42-generic root=/dev/mapper/vgubuntu-root ro quiet splash 
           acpi_backlight=vendor vt.handoff=7 
           Desktop: Gnome 3.36.3 wm: gnome-shell dm: GDM3 3.34.1 Distro: Ubuntu 20.04.1 LTS (Focal Fossa) 
Machine:   Type: Laptop System: Acer product: Aspire A715-41G v: V1.00 serial: <filter> 
           Mobo: PK model: Azalea_PKS v: V1.00 serial: <filter> UEFI: INSYDE v: 1.00 date: 03/13/2020 
Battery:   ID-1: BAT1 charge: 12.7 Wh condition: 50.1/47.8 Wh (105%) volts: 10.6/11.2 model: LGC AP18C8K type: Li-ion 
           serial: <filter> status: Discharging 
CPU:       Topology: Quad Core model: AMD Ryzen 5 3550H with Radeon Vega Mobile Gfx bits: 64 type: MT MCP arch: Zen+ 
           family: 17 (23) model-id: 18 (24) stepping: 1 microcode: 8108109 L2 cache: 2048 KiB 
           flags: avx avx2 lm nx pae sse sse2 sse3 sse4_1 sse4_2 sse4a ssse3 svm bogomips: 33537 
           Speed: 1220 MHz min/max: 1400/2100 MHz boost: enabled Core speeds (MHz): 1: 1223 2: 1223 3: 1222 4: 1222 5: 1221 
           6: 1222 7: 1222 8: 1222 
           Vulnerabilities: Type: itlb_multihit status: Not affected 
           Type: l1tf status: Not affected 
           Type: mds status: Not affected 
           Type: meltdown status: Not affected 
           Type: spec_store_bypass mitigation: Speculative Store Bypass disabled via prctl and seccomp 
           Type: spectre_v1 mitigation: usercopy/swapgs barriers and __user pointer sanitization 
           Type: spectre_v2 mitigation: Full AMD retpoline, IBPB: conditional, STIBP: disabled, RSB filling 
           Type: srbds status: Not affected 
           Type: tsx_async_abort status: Not affected 

Ubuntu 20.04 설치는 순조롭게 진행되었는데, nvidia 드라이버(sudo apt install nvidia-driver-440)를 설치하니,재부팅 후 시스템이 충돌했습니다.

해결 방법: 이 내용이 포함된 /etc/modprobe.d/ 파일로 nouveau 드라이버를 블랙리스트에 추가하세요.

blacklist nouveau
options nouveau modeset = 0

덕분에 우분투를 시작할 수 있어요

다음 문제: 밝기를 높이거나 낮추는 버튼이 바뀌었습니다. 해결책: acpi_backlight = vendor/etc/default/grub 파일에 추가했습니다.

또 다른 문제:nvidia dGPU로 인해 높은 배터리 소모가 항상 4W를 소모했습니다..

해결 방법: 이 페이지의 NVIDIA 권장 사항을 따랐습니다.http://download.nvidia.com/XFree86/Linux-x86_64/440.100/README/dynamicpowermanagement.html동적 전원 관리에 대해.

이 내용으로 /lib/udev/rules.d/ 디렉토리에 80-nvidia-pm.rules 파일을 만들었습니다.

# Remove NVIDIA USB xHCI Host Controller devices, if present
ACTION=="add", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x0c0330", ATTR{remove}="1"

# Remove NVIDIA USB Type-C UCSI devices, if present
ACTION=="add", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x0c8000", ATTR{remove}="1"

# Remove NVIDIA Audio devices, if present
ACTION=="add", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x040300", ATTR{remove}="1"

# Enable runtime PM for NVIDIA VGA/3D controller devices on driver bind
ACTION=="bind", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x030000", TEST=="power/control", ATTR{power/control}="auto"
ACTION=="bind", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x030200", TEST=="power/control", ATTR{power/control}="auto"

# Disable runtime PM for NVIDIA VGA/3D controller devices on driver unbind
ACTION=="unbind", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x030000", TEST=="power/control", ATTR{power/control}="on"
ACTION=="unbind", SUBSYSTEM=="pci", ATTR{vendor}=="0x10de", ATTR{class}=="0x030200", TEST=="power/control", ATTR{power/control}="on"

그리고 다음 내용으로 /etc/modprobe.d/nvidia.conf 파일을 만들었습니다.


options nvidia "NVreg_DynamicPowerManagement=0x02"

덕분에 배터리 성능이 좋아졌어요3시간에서 6시간 이상.

그때까지 그런 것들은 모두 그 문제에 대한 만족스러운 해결책이었고,하지만 여전히 좋은 해결책을 찾을 수 없는 문제가 있습니다. 그리고 그것은 무엇보다도 가장 중요한 문제입니다. AMD iGPU와 nvidia dGPU가 제대로 작동하도록 하는 솔루션을 찾을 수 없습니다.

nvidia 드라이버를 설치하고 nouveau 드라이버를 블랙리스트에 올린 후 nvidia x 서버 설정에 콘텐츠가 없는 창이 표시되고 nvidia-smi 명령을 실행하면 프로세스가 없다고 표시됩니다. /etc/X11 디렉터리를 확인했는데 xorg.conf 파일이 없습니다.

엔비디아 x 서버가 비어 있음

$ nvidia-smi
Sun Aug  9 00:53:55 2020       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100      Driver Version: 440.100      CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1650    Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   38C    P0     2W /  N/A |      0MiB /  3914MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

$ inxi -xxxG
Graphics:  Device-1: NVIDIA vendor: Acer Incorporated ALI driver: nvidia v: 440.100 bus ID: 01:00.0 chip ID: 10de:1f99 
           Device-2: Advanced Micro Devices [AMD/ATI] Picasso vendor: Acer Incorporated ALI driver: amdgpu v: kernel 
           bus ID: 05:00.0 chip ID: 1002:15d8 
           Display: x11 server: X.Org 1.20.8 driver: modesetting unloaded: nvidia alternate: ati,fbdev,nouveau,vesa 
           compositor: gnome-shell v: 3.36.3 resolution: 1920x1080~60Hz 
           OpenGL: renderer: AMD RAVEN (DRM 3.35.0 5.4.0-42-generic LLVM 10.0.0) v: 4.6 Mesa 20.0.8 direct render: Yes 

$ xrandr --listproviders
Providers: number : 1
Provider 0: id: 0x45 cap: 0x9, Source Output, Sink Offload crtcs: 4 outputs: 2 associated providers: 0 name:modesetting

웹을 검색한 후 이 모델 xorg.conf 파일을 찾았습니다.

Section "ServerLayout"
        Identifier "layout"
        Option "AllowNVIDIAGPUScreens"
EndSection

Section "Device"
        Identifier "AMDGPU"
        Driver "amdgpu"
        Option "TearFree" "true"
EndSection

Section "OutputClass"
        Identifier "iGPU"
        MatchDriver "amdgpu"
        Driver "modesetting"
EndSection

Section "Device"
        Identifier "nvidia"
        Driver "nvidia"
EndSection

Section "OutputClass"
        Identifier "nvidia"
        MatchDriver "nvidia-drm"
        Driver "nvidia"
        Option "AllowEmptyInitialConfiguration"
        ModulePath "/usr/lib/nvidia/xorg"
        ModulePath "/usr/lib/xorg/modules"
EndSection

저는 무엇이든 복사하고 붙여넣는 것을 좋아하지 않지만 이렇게 하면 작동하게 되었고 이제 nvidia x 서버 설정에 콘텐츠가 표시되고 nvidia-smi에 프로세스가 표시됩니다.

nvidia x 서버는 이제 뭔가를 보여줍니다

$nvidia-smi

Sun Aug  9 00:43:55 2020       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.100      Driver Version: 440.100      CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1650    Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   36C    P8     1W /  N/A |     49MiB /  3914MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1249      G   /usr/lib/xorg/Xorg                            14MiB |
|    0      1897      G   /usr/lib/xorg/Xorg                            34MiB |
+-----------------------------------------------------------------------------+

$inxi -xxxG
Graphics:  Device-1: NVIDIA vendor: Acer Incorporated ALI driver: nvidia v: 440.100 bus ID: 01:00.0 chip ID: 10de:1f99 
           Device-2: Advanced Micro Devices [AMD/ATI] Picasso vendor: Acer Incorporated ALI driver: amdgpu v: kernel 
           bus ID: 05:00.0 chip ID: 1002:15d8 
           Display: x11 server: X.Org 1.20.8 driver: modesetting,nvidia alternate: amdgpu,ati,fbdev,nouveau,vesa 
           compositor: gnome-shell v: 3.36.3 resolution: 1920x1080~60Hz 
           OpenGL: renderer: AMD RAVEN (DRM 3.35.0 5.4.0-42-generic LLVM 10.0.0) v: 4.6 Mesa 20.0.8 direct render: Yes 

$xrandr --listproviders
Providers: number : 2
Provider 0: id: 0x45 cap: 0x9, Source Output, Sink Offload crtcs: 4 outputs: 2 associated providers: 0 name:modesetting
Provider 1: id: 0x231 cap: 0x0 crtcs: 0 outputs: 0 associated providers: 0 name:NVIDIA-G0

이 솔루션의 단점은시스템이 불안정해집니다. 로그인 화면에서 포인터가 안 보일 때가 있고, 다시 시작하면 시간이 좀 더 걸리긴 하지만,몇 분 있다가 노트북을 켜면 시스템에 검은색 화면이 표시됩니다., SSH 액세스 권한도 없으며 완전히 껐다가 다시 켜려고 한두 번 시도한 후에 작동하게 됩니다.

뭔가 매우 잘못되었음을 보여주는 dmesg


[   29.654785] kernel: [drm:amdgpu_job_timedout [amdgpu]] *ERROR* ring gfx timeout, signaled seq=1, emitted seq=3
[   29.654918] kernel: [drm:amdgpu_job_timedout [amdgpu]] *ERROR* Process information: process Xorg pid 1249 thread Xorg:cs0 pid 1344
[   29.654926] kernel: amdgpu 0000:05:00.0: GPU reset begin!
[   30.777283] kernel: amdgpu 0000:05:00.0: GPU reset succeeded, trying to resume
[   30.777892] kernel: [drm] PCIE GART of 1024M enabled (table at 0x000000F400900000).
[   30.778481] kernel: [drm] PSP is resuming...
[   30.798357] kernel: [drm] reserve 0x400000 from 0xf47f800000 for PSP TMR
[   30.809000] kernel: [drm] psp command failed and response status is (0x7)
[   31.479027] kernel: [drm] VCN decode and encode initialized successfully(under DPG Mode).
[   31.479037] kernel: amdgpu 0000:05:00.0: ring gfx uses VM inv eng 0 on hub 0
[   31.479040] kernel: amdgpu 0000:05:00.0: ring comp_1.0.0 uses VM inv eng 1 on hub 0
[   31.479043] kernel: amdgpu 0000:05:00.0: ring comp_1.1.0 uses VM inv eng 4 on hub 0
[   31.479045] kernel: amdgpu 0000:05:00.0: ring comp_1.2.0 uses VM inv eng 5 on hub 0
[   31.479048] kernel: amdgpu 0000:05:00.0: ring comp_1.3.0 uses VM inv eng 6 on hub 0
[   31.479050] kernel: amdgpu 0000:05:00.0: ring comp_1.0.1 uses VM inv eng 7 on hub 0
[   31.479052] kernel: amdgpu 0000:05:00.0: ring comp_1.1.1 uses VM inv eng 8 on hub 0
[   31.479054] kernel: amdgpu 0000:05:00.0: ring comp_1.2.1 uses VM inv eng 9 on hub 0
[   31.479057] kernel: amdgpu 0000:05:00.0: ring comp_1.3.1 uses VM inv eng 10 on hub 0
[   31.479059] kernel: amdgpu 0000:05:00.0: ring kiq_2.1.0 uses VM inv eng 11 on hub 0
[   31.479062] kernel: amdgpu 0000:05:00.0: ring sdma0 uses VM inv eng 0 on hub 1
[   31.479064] kernel: amdgpu 0000:05:00.0: ring vcn_dec uses VM inv eng 1 on hub 1
[   31.479065] kernel: amdgpu 0000:05:00.0: ring vcn_enc0 uses VM inv eng 4 on hub 1
[   31.479068] kernel: amdgpu 0000:05:00.0: ring vcn_enc1 uses VM inv eng 5 on hub 1
[   31.479070] kernel: amdgpu 0000:05:00.0: ring vcn_jpeg uses VM inv eng 6 on hub 1
[   31.490635] kernel: [drm] recover vram bo from shadow start
[   31.490636] kernel: [drm] recover vram bo from shadow done
[   31.490637] kernel: [drm] Skip scheduling IBs!
[   31.490675] kernel: ------------[ cut here ]------------
[   31.490681] kernel: WARNING: CPU: 3 PID: 74 at include/linux/dma-fence.h:533 drm_sched_resubmit_jobs+0x152/0x160 [gpu_sched]
[   31.490682] kernel: Modules linked in: ccm cmac algif_hash algif_skcipher vboxnetadp(OE) vboxnetflt(OE) af_alg vboxdrv(OE) bnep binfmt_misc nls_iso8859_1 snd_soc_dmic snd_hda_codec_realtek snd_acp3x_pdm_dma acp3x_rn snd_hda_codec_generic ledtrig_audio snd_soc_core snd_hda_codec_hdmi snd_compress ac97_bus snd_pcm_dmaengine snd_hda_intel snd_intel_dspcfg snd_hda_codec uvcvideo joydev snd_hda_core snd_hwdep videobuf2_vmalloc videobuf2_memops edac_mce_amd btusb btrtl videobuf2_v4l2 btbcm snd_pcm videobuf2_common kvm_amd btintel bluetooth snd_seq_midi ccp videodev snd_seq_midi_event iwlmvm ecdh_generic kvm ecc snd_rawmidi mc mac80211 snd_seq snd_seq_device libarc4 snd_timer hid_multitouch input_leds serio_raw acer_wmi wmi_bmof sparse_keymap k10temp iwlwifi snd snd_rn_pci_acp3x snd_pci_acp3x cfg80211 soundcore mac_hid acer_wireless nvidia_uvm(OE) sch_fq_codel parport_pc ppdev lp parport ip_tables x_tables autofs4 dm_crypt nvidia_drm(POE) nvidia_modeset(POE) nvidia(POE) amdgpu crct10dif_pclmul
[   31.490707] kernel:  crc32_pclmul ghash_clmulni_intel amd_iommu_v2 hid_generic aesni_intel gpu_sched i2c_algo_bit ttm crypto_simd cryptd drm_kms_helper glue_helper syscopyarea sysfillrect nvme sysimgblt fb_sys_fops r8169 ahci ipmi_devintf i2c_piix4 drm libahci nvme_core realtek ipmi_msghandler i2c_hid video hid wmi
[   31.490720] kernel: CPU: 3 PID: 74 Comm: kworker/3:1 Tainted: P           OE     5.4.0-42-generic #46-Ubuntu
[   31.490721] kernel: Hardware name: Acer Aspire A715-41G/Azalea_PKS, BIOS V1.00 03/13/2020
[   31.490724] kernel: Workqueue: events drm_sched_job_timedout [gpu_sched]
[   31.490727] kernel: RIP: 0010:drm_sched_resubmit_jobs+0x152/0x160 [gpu_sched]
[   31.490729] kernel: Code: 41 5c 41 5d 41 5e 41 5f 5d c3 49 8b 46 10 31 c9 48 c7 80 80 00 00 00 00 00 00 00 49 8b 7f 70 31 c0 83 e7 01 74 04 0f 0b eb bf <0f> 0b eb c7 0f 0b eb 8b 66 0f 1f 44 00 00 0f 1f 44 00 00 55 48 89
[   31.490730] kernel: RSP: 0018:ffffab6b403d3d28 EFLAGS: 00010246
[   31.490731] kernel: RAX: 0000000000000000 RBX: 0000000000000001 RCX: 0000000000000000
[   31.490732] kernel: RDX: ffffa069d4b4a280 RSI: ffffa069e3dcb1f8 RDI: 0000000000000000
[   31.490733] kernel: RBP: ffffab6b403d3d60 R08: 000000000000050b R09: 0000000000000004
[   31.490733] kernel: R10: 0000000000000000 R11: 0000000000000001 R12: ffffa069d1b87ad8
[   31.490734] kernel: R13: ffffa069d1b87980 R14: ffffa069e3dcb000 R15: ffffa069d4b4a240
[   31.490735] kernel: FS:  0000000000000000(0000) GS:ffffa069e88c0000(0000) knlGS:0000000000000000
[   31.490736] kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[   31.490737] kernel: CR2: 00007f4aeb7fdb38 CR3: 00000001e043a000 CR4: 00000000003406e0
[   31.490738] kernel: Call Trace:
[   31.490827] kernel:  amdgpu_device_gpu_recover+0x6cd/0x95a [amdgpu]
[   31.490907] kernel:  amdgpu_job_timedout+0x103/0x130 [amdgpu]
[   31.490909] kernel:  drm_sched_job_timedout+0x44/0x90 [gpu_sched]
[   31.490914] kernel:  process_one_work+0x1eb/0x3b0
[   31.490916] kernel:  worker_thread+0x4d/0x400
[   31.490919] kernel:  kthread+0x104/0x140
[   31.490921] kernel:  ? process_one_work+0x3b0/0x3b0
[   31.490922] kernel:  ? kthread_park+0x90/0x90
[   31.490927] kernel:  ret_from_fork+0x22/0x40
[   31.490928] kernel: ---[ end trace 3f6c6090efb5a251 ]---
[   31.490960] kernel: amdgpu 0000:05:00.0: GPU reset(2) succeeded!

또한 xorg.conf 파일의 다음 내용으로 인해 시스템이 불안정하다는 것도 확인했습니다.

Section "ServerLayout"
      Identifier "layout"
      Option "AllowNVIDIAGPUScreens"
EndSection

아이디어가 부족합니다. AMD + Nvidia 하이브리드 그래픽 시스템을 구성하는 올바른 방법을 아는 사람이 있습니까?

여기 오셨다면 시간을 내어 이 모든 내용을 읽어주셔서 감사합니다. 제가 수집할 수 있는 모든 정보를 제공하려고 노력했습니다.

글에서 이상한 점이 발견된다면 양해 부탁드립니다. 영어는 제 모국어가 아니고 평소에 글을 자주 쓰지도 않습니다.

편집하다:SSH를 통해 접근이 가능했습니다. 제가 수집한 정보는 이렇습니다dmesg가 포함된 페이스트빈

재부팅하는 유일한 방법은 작동 하지도 않았고 모든 것이 느리고 차단되었기 echo b /proc/sysrq-trigger때문 입니다.sudo rebootsystemctl reboot

내가 전에 말했듯이,이 충돌은 노트북을 켤 때 발생합니다., 재부팅하면 발생하지 않습니다

답변1

저는 동일한 노트북을 가지고 있는데 무엇을 해야 할지 실시간으로 선택할 필요 없이 방금 Pop!_OS를 설치했는데 완벽하게 작동하며 통합, 전용 또는 하이브리드 GPU 모드만 사용하도록 선택할 수 있습니다.

관련 정보