Ubuntu 20.04 충돌: ECC 오류 또는 L2 포이즌이 감지되었습니다.

Ubuntu 20.04 충돌: ECC 오류 또는 L2 포이즌이 감지되었습니다.

Ubuntu 20.04는 서로 다른 시간에 무작위로 충돌합니다. 특정 이벤트를 가리킬 수 없습니다.

uname -a 
Linux ubuntu 5.11.0-051100-generic #202102142330 
SMP Sun Feb 14 23:33:21 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux

다음 신호와 함께 충돌이 발생합니다.

 kernel:[19849.215258] [Hardware Error]: Uncorrected, software restartable error.

 kernel:[19849.215259] [Hardware Error]: CPU:22 (19:21:0) MC0_STATUS[-|UE|MiscV|AddrV|-|-|-|-|Poison|-]: 0xbc00080001010135

 kernel:[19849.215263] [Hardware Error]: Error Addr: 0x000000076bed1c00

 kernel:[19849.215264] [Hardware Error]: IPID: 0x001000b000000000

 kernel:[19849.215266] [Hardware Error]: Load Store Unit Ext. Error Code: 1, An ECC error or L2 poison was detected on a data cache read by a load.

 kernel:[19849.215269] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: DRD

하드웨어 정보:

### CPU
  Architecture:                    x86_64
  CPU op-mode(s):                  32-bit, 64-bit
  Byte Order:                      Little Endian
  Address sizes:                   48 bits physical, 48 bits virtual
  CPU(s):                          24
  On-line CPU(s) list:             0-23
  Thread(s) per core:              2
  Core(s) per socket:              12
  Socket(s):                       1
  NUMA node(s):                    1
  Vendor ID:                       AuthenticAMD
  CPU family:                      25
  Model:                           33
  Model name:                      AMD Ryzen 9 5900X 12-Core Processor
  Stepping:                        0
  Frequency boost:                 enabled
  CPU MHz:                         2200.000
  CPU max MHz:                     6442.4800
  CPU min MHz:                     2200.0000

### Base Board Information
  Manufacturer: ASRock
  Product Name: X570 Taichi

### Memory:
G Skill Trident Z Neo DDR4 - 3600Mhz 32GB (2 x 16GB)

근본 원인을 찾기 위해 제안되는 방법은 무엇입니까? 추가 로깅을 활성화하려면 어떻게 해야 하는지 또는 로그가 이미 존재하는 경우 어디에서 찾을 수 있는지 등을 알려주시면 감사하겠습니다. 감사해요!

답변1

이건 아니다기술적으로답변이지만...

메시지 ECC error or L2 poison was detected on a data cache read by a load는 RAM 자체나 CPU의 캐시에 메모리 문제가 있음을 나타냅니다. 둘 다 좋지는 않지만 다음 프로세스를 통해 시스템 RAM을 테스트할 수 있습니다.

  1. 시스템을 다시 시작하세요
  2. 키 를 길게 눌러 ShiftGRUB 메뉴를 불러옵니다.
  3. "Ubuntu, memtest86+"를 선택하고 키를 누릅니다. Enter
    메모리 테스트는 시간이 끝나거나 Esc키를 누를 때까지 실행됩니다. 탈출하기 전에 기계가 최소한 한 번의 테스트를 완료하도록 하세요.

기반보고서 웹에서 이 문제는 고급형 AMD Ryzen 프로세서에서만 나타나는 것 같습니다. 를 통해 읽기이 긴 실AMD 커뮤니티 사이트에서 다음과 같은 흥미로운 내용이 공개되었습니다.

메모리를 교체했는데 컴퓨터가 며칠 동안 견고하게 작동했습니다. 이것이 나에게 도움이 되었듯이 여러분에게도 도움이 되기를 바랍니다. 이전 메모리는 Gskill 3600mhz 메모리였는데... 새로운 메모리는 Corsair의 3200 메모리입니다.

귀하의 질문에는 어떤 종류의 메모리를 설치했는지 명시되어 있지 않지만, 더 높은 주파수의 모듈 세트인 경우 RAM과 CPU 사이에 불안정을 일으키는 무언가가 있을 수 있습니다. 메모리 테스트가 실패하고 사용 가능한 호환 가능한 3200MHz RAM이 있는 경우(단 하나의 DIMM이라도) 이를 교체하고 메모리 테스트를 다시 수행하는 것이 좋습니다.

답변2

바이오스

ASRock X570 타이치

BIOS는 현재 버전 P4.30입니다.

메모리

G Skill Trident Z Neo DDR4 - 3600Mhz 32GB(2 x 16GB), 제품: F4-3600C16-16GTZNC

AMD Ryzen 9 5900X 12코어 프로세서

Ryzen 프로세서는 RAM에 대해 매우 까다롭습니다.

이러한 DIMM은 표시된 대로 메모리 지원 목록에 나타나지 않습니다.여기.

memtest모든 테스트를 통과했습니다.

살펴보면 sudo lshw -C memoryDIMM이5월잘못된 슬롯 위치에 설치되었습니다. 동일한 크기의 DIMM 2개를 사용하는 경우 슬롯 A2와 B2에 설치해야 합니다. 다음은 보드 레이아웃과 메모리 슬롯의 이미지입니다. 사용자 설명서에서 가져온 것입니다.여기... 그러니 확인해 보세요...

여기에 이미지 설명을 입력하세요

답변3

@heynnema의 제안에 따라 내 컴퓨터에 설치된 DIMM 모델이 호환성 목록에 나열되어 있지 않다는 것을 알 수 있었습니다. 수행된 단계는 다음과 같습니다.

  1. CPU 지원 목록을 방문하십시오.ASRock x570 Taichi 웹사이트. 핵심 유형을 알아보세요. 내 경우에는 그랬다.Vermeer
  2. sudo lshw -C memory다음을 실행하여 시스템에 설치된 DIMM 모델을 확인합니다 F4-3600C16-16GTZNC.
  3. 다음으로 이동하세요.메모리 지원 목록Vermeer의 경우 지원되는지 확인하세요. 불행히도 목록에는 없습니다! 아마도 그것이 일관되지 않은 충돌의 원인일 것입니다. 지원되는 버전의 DIMM을 사용해 충돌이 다시 발생하는지 확인하고 이에 따라 이 답변을 업데이트하겠습니다.
 *-firmware
       description: BIOS
       vendor: American Megatrends Inc.
       physical id: 0
       version: P4.30
       date: 04/14/2021
       size: 64KiB
       capacity: 16MiB
       capabilities: pci upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
  *-memory
       description: System Memory
       physical id: e
       slot: System board or motherboard
       size: 32GiB
     *-bank:0
          description: DIMM DDR4 Synchronous Unbuffered (Unregistered) 2133 MHz (0.5 ns)
          product: F4-3600C16-16GTZNC
          vendor: Unknown
          physical id: 0
          serial: 00000000
          slot: DIMM 0
          size: 16GiB
          width: 64 bits
          clock: 2133MHz (0.5ns)
     *-bank:1
          description: Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected]>Language-Team: English (Australia) <[email protected]>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5)Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected]>Language-Team: English (Australia) <[email protected]>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5) [empty]
          product: Unknown
          vendor: Unknown
          physical id: 1
          serial: Unknown
          slot: DIMM 1
     *-bank:2
          description: DIMM DDR4 Synchronous Unbuffered (Unregistered) 2133 MHz (0.5 ns)
          product: F4-3600C16-16GTZNC
          vendor: Unknown
          physical id: 2
          serial: 00000000
          slot: DIMM 0
          size: 16GiB
          width: 64 bits
          clock: 2133MHz (0.5ns)
     *-bank:3
          description: Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected]>Language-Team: English (Australia) <[email protected]>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5)Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <[email protected]>Language-Team: English (Australia) <[email protected]>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5) [empty]
          product: Unknown
          vendor: Unknown
          physical id: 3
          serial: Unknown
          slot: DIMM 1
  *-cache:0
       description: L1 cache
       physical id: 11
       slot: L1 - Cache
       size: 768KiB
       capacity: 768KiB
       clock: 1GHz (1.0ns)
       capabilities: pipeline-burst internal write-back unified
       configuration: level=1
  *-cache:1
       description: L2 cache
       physical id: 12
       slot: L2 - Cache
       size: 6MiB
       capacity: 6MiB
       clock: 1GHz (1.0ns)
       capabilities: pipeline-burst internal write-back unified
       configuration: level=2
  *-cache:2
       description: L3 cache
       physical id: 13
       slot: L3 - Cache
       size: 64MiB
       capacity: 64MiB
       clock: 1GHz (1.0ns)
       capabilities: pipeline-burst internal write-back unified
       configuration: level=3

관련 정보