소프트웨어 이벤트만 사용하여 손상된 PMU 하드웨어가 감지되었습니다.

소프트웨어 이벤트만 사용하여 손상된 PMU 하드웨어가 감지되었습니다.

실행 시(ubuntu 또는 debian의 linux-tools-common에서) CPU 하드웨어 카운터를 표시하지 않는 시스템 4개 중 2개(dell r815)가 있습니다.

perf list

나는 strace를 사용했고 문제가 있는 두 시스템에 /sys/devices/cpu가 없다는 것이 문제라는 것을 발견했습니다. 나는 이것을 dmesg의 오류로 추적했습니다.

Performance Events: Broken PMU hardware detected, using software events only.

작동하는 기계에는 이렇게 적혀 있어요

Performance Events: AMD PMU driver.

제 질문은 이것이 단순한 소프트웨어나 구성 문제가 아닌지 확인하려면 어떻게 해야 합니까?입니다. 제가 보기엔 하드웨어 불량인 것 같습니다.

답변1

문제는 영향을 받는 컴퓨터의 CPU에 있는 마이크로코드 버전이 더 오래되었다는 것이었습니다. 마이크로코드를 업데이트한 amd64-microcode 패키지를 설치하려고 시도했지만 PMU 오류가 이미 dmesg에 표시된 후에만 시도했습니다. Dell의 부팅 가능한 서버 구성 도구를 사용하여 BIOS와 시스템 펌웨어를 업데이트했고 문제가 해결되었습니다. 이 내용이 같은 문제에 직면한 다른 사람에게 도움이 되기를 바랍니다.

관련 정보