메모리 로그에 CE 오류가 발생했습니다.

메모리 로그에 CE 오류가 발생했습니다.

저는 HP 서버(DL360-G7)를 가지고 있고 Centos7 + cPanel을 실행하고 있습니다. /var/log/message에 다음 오류가 표시됩니다.

EDAC MC0: 5450 CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0

서버의 RAM과 메모리 슬롯을 변경했지만 아직 오류가 발생합니다.

EDAC MC0: 25509 CE error on CPU#0Channel#0_DIMM#0 (channel:0 slot:0

내가 이 명령을 실행할 때:

grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count

다음 출력이 표시됩니다.

/sys/devices/system/edac/mc/mc0/csrow0/ch0_ce_count:5067071

/sys/devices/system/edac/mc/mc1/csrow0/ch0_ce_count:0

ILO 패널에는 오류가 없습니다!

뭐가 문제 야?

답변1

위의 로그에서 오류는 수정 가능한 오류라고 말할 수 있습니다. (채널:1 슬롯:0 및 채널:0 슬롯:0)은 2개 채널에 문제(수정 가능한 문제)가 있음을 의미합니다. 채널은 DIMM 그룹과 통신하는 메모리 컨트롤러 채널입니다. 각 채널에는 고유한 독립적인 제어(명령) 및 데이터 버스가 있으며 독립적으로 사용하거나 다른 채널과 그룹화할 수 있습니다. 이 페이지를 확인하세요https://www.kernel.org/doc/html/latest/driver-api/edac.html?highlight=edac#main-concepts-used-at-the-edac-subsystem. 개수가 너무 높으면 DIMM을 교체하고 마더보드에 하드웨어 오류가 있는지 확인하는 것이 좋습니다. 때로는 DIMM에 문제가 없는 문제가 보드 자체에 있을 수 있습니다. 낮은 CE 오류 수는 무시할 수 있습니다.

관련 정보