Defekte PMU-Hardware erkannt, nur mithilfe von Softwareereignissen

Defekte PMU-Hardware erkannt, nur mithilfe von Softwareereignissen

Auf zwei von vier meiner Maschinen (Dell R815) werden beim Ausführen die CPU-Hardwareindikatoren nicht angezeigt (von Linux-Tools-Common unter Ubuntu oder Debian):

perf list

Ich habe strace verwendet und festgestellt, dass das Problem darin besteht, dass /sys/devices/cpu auf den beiden betroffenen Rechnern fehlt. Ich habe dies auf einen Fehler in dmesg zurückgeführt:

Performance Events: Broken PMU hardware detected, using software events only.

Auf den Maschinen, die funktionieren, steht

Performance Events: AMD PMU driver.

Meine Frage ist: Was kann ich tun, um sicherzustellen, dass es sich nicht nur um ein Software- oder Konfigurationsproblem handelt? Für mich sieht es so aus, als ob es sich um fehlerhafte Hardware handeln könnte.

Antwort1

Ich fand heraus, dass das Problem darin bestand, dass die Mikrocode-Version auf den CPUs der betroffenen Maschinen älter war. Ich versuchte, das Paket amd64-microcode zu installieren, das den Mikrocode tatsächlich aktualisierte, aber erst, nachdem der PMU-Fehler bereits in dmesg angezeigt wurde. Ich verwendete Dells bootfähiges Serverkonfigurationstool, um das BIOS und die System-Firmware zu aktualisieren, und es behob das Problem. Hoffentlich hilft dies jedem, der auf dasselbe Problem stößt.

verwandte Informationen