Estou tentando ativar o ECC para confirmar o recurso RAS emUbuntu-18.04
É modo GIGABYTE BIOS, verifiquei a opção ECC, mas não está presente. e os detalhes do servidor são:
:~$ lscpu
Architecture: x86_64
CPU op-mode(s): 32-bit, 64-bit
Byte Order: Little Endian
CPU(s): 64
On-line CPU(s) list: 0-63
Thread(s) per core: 2
Core(s) per socket: 32
Socket(s): 1
NUMA node(s): 4
Vendor ID: AuthenticAMD
CPU family: 23
Model: 8
Model name: AMD Ryzen Threadripper 2990WX 32-Core Processor
Stepping: 2
CPU MHz: 1715.339
...
Driver AMD64 EDAC para verificação ECC Clonou o kernel mais recente "5.3.0-rc1" e habilitou configurações relacionadas ao EDAC, compilou e gerou debians.
Instalei a imagem do kernel e os cabeçalhos debians em ubutnu18.04.
após a inicialização não consigo listar o módulo edacamd64_edac_mod.koem "lsmod"
:~$ lsmod | grep edac
edac_mce_amd 32768 0
Verifique os logs do dmesg, estou vendo as mensagens de erro abaixo:
[ 17.489578] EDAC amd64: Node 0: DRAM ECC disabled.
[ 17.489580] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
(Note that use of the override may cause unknown side effects.)
[ 17.489584] EDAC amd64: Node 1: DRAM ECC disabled.
[ 17.489585] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
(Note that use of the override may cause unknown side effects.)
Mas não há registros relacionados aInicialização do driver AMD64_EDAC
Verifique novamente o caminho se os drivers foram compilados ou não conforme abaixo eamd64_edac_mod.kopresente.
:~$ ls /lib/modules/5.3.0-rc1-test/kernel/drivers/edac/
**amd64_edac_mod.ko** **edac_mce_amd.ko** i3200_edac.ko i5100_edac.ko i7300_edac.ko i82975x_edac.ko pnd2_edac.ko skx_edac.ko
e752x_edac.ko i3000_edac.ko i5000_edac.ko i5400_edac.ko i7core_edac.ko ie31200_edac.ko sb_edac.ko x38_edac.ko
Tentei inserir manualmente o módulo, mas falhou:
/lib/modules/5.3.0-rc1-test/kernel/drivers/edac$ sudo modprobe -v amd64_edac_mod
insmod /lib/modules/5.3.0-rc1-test/kernel/drivers/edac/amd64_edac_mod.ko
modprobe: ERROR: could not insert 'amd64_edac_mod': No such device
Por causa do driver acima não instalado, emMC->mc0emc1controladores de memória não estão listados
:~$ ls /sys/devices/system/edac/mc/
power subsystem uevent
Poderia me ajudar o motivo pelo qual o driver não foi instalado?