Estoy intentando habilitar ECC para confirmar la función RAS enubuntu-18.04
Es el modo BIOS de GIGABYTE. He marcado la opción ECC, pero no está presente. y los detalles del servidor son:
:~$ lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 64
On-line CPU(s) list: 0-63
Thread(s) per core: 2
Core(s) per socket: 32
Socket(s): 1
NUMA node(s): 4
Vendor ID: AuthenticAMD
CPU family: 23
Model: 8
Model name: AMD Ryzen Threadripper 2990WX 32-Core Processor
Stepping: 2
CPU MHz: 1715.339
...
Controlador AMD64 EDAC para verificación ECC Cloné el último kernel "5.3.0-rc1" y habilité configuraciones relacionadas con EDAC, compilé y generé Debians.
Instalé la imagen del kernel y los encabezados de Debian en ubutnu18.04.
Después del arranque no puedo enumerar el módulo edac.amd64_edac_mod.koen "lsmod"
:~$ lsmod | grep edac
edac_mce_amd 32768 0
Verifique los registros de dmesg; veo los siguientes mensajes de error:
[ 17.489578] EDAC amd64: Node 0: DRAM ECC disabled.
[ 17.489580] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
(Note that use of the override may cause unknown side effects.)
[ 17.489584] EDAC amd64: Node 1: DRAM ECC disabled.
[ 17.489585] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
(Note that use of the override may cause unknown side effects.)
Pero no hay registros relacionados conInicialización del controlador AMD64_EDAC
Nuevamente verifique la ruta, ya sea que los controladores estén compilados o no, como se muestra a continuación yamd64_edac_mod.kopresente.
:~$ ls /lib/modules/5.3.0-rc1-test/kernel/drivers/edac/
**amd64_edac_mod.ko** **edac_mce_amd.ko** i3200_edac.ko i5100_edac.ko i7300_edac.ko i82975x_edac.ko pnd2_edac.ko skx_edac.ko
e752x_edac.ko i3000_edac.ko i5000_edac.ko i5400_edac.ko i7core_edac.ko ie31200_edac.ko sb_edac.ko x38_edac.ko
Intenté insertar manualmente el módulo, pero falló:
/lib/modules/5.3.0-rc1-test/kernel/drivers/edac$ sudo modprobe -v amd64_edac_mod
insmod /lib/modules/5.3.0-rc1-test/kernel/drivers/edac/amd64_edac_mod.ko
modprobe: ERROR: could not insert 'amd64_edac_mod': No such device
Debido a que el controlador anterior no está instalado, enmc->mc0ymc1Los controladores de memoria no están listados.
:~$ ls /sys/devices/system/edac/mc/
power subsystem uevent
¿Podría ayudarme con el motivo por el cual el controlador no está instalado?