Linux de 64 bits não reconhece minha RAM entre 3 e 32 GB

Linux de 64 bits não reconhece minha RAM entre 3 e 32 GB

Meus problemas foram causados ​​por um módulo de memória com defeitoe possivelmente um binário de kernel quebrado.


Acabei de inicializar meu PC com hardware basicamente novo. Já usei o Debian 6.0 AMD64 antes e nenhuma mudança (literalmente; apenas desconectei os discos rígidos da placa-mãe antiga e os reconectei à nova), mas encontrei algo curioso:

  • Eu instalei fisicamente 4 x 8 GB de RAM
  • A configuração UEFI/BIOS relata 16383 MB de RAM
  • Linux free -mrelata 2.985 MB de RAM

2.985 MB parece muito próximo da marca mágica de 3 GB para ser mera coincidência, mas uname -rimprime 2.6.32-5-amd64; claramente um kernel de 64 bits, que é tudo o que já foi instalado na unidade do sistema que estou usando. A nova placa-mãe é uma Asus M5A97 Pro, que possui quatro slots DDR3 que supostamente suportam módulos de 8 GB. Os módulos de memória em si são idênticos, quatro Corsair XMS3 PC12800 8 GB, adquiridos juntos.

Não examinei detalhadamente a configuração do UEFI, mas naveguei por ela e não vi nada que parecesse precisar ser alterado para ativar grandes quantidades de RAM.

Editar:Mais uma confirmação de que realmente estou executando 64 bits:

# file `which free`
/usr/bin/free: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped
#

O que há com isso e o que posso fazer sobre isso?

Editar 2:dmesg, dmidecode e meminfo, conforme solicitado. Não tenho acesso físico ao sistema no momento, então terei que esperar até hoje à noite para retirar alguns módulos e ver o que isso faz. (Observe que dmidecode relata 3 x 8 GB mais um slot DIMM vazio. Observe também a mensagem de incompatibilidade MTRR do kernel, levando a uma perda de 13 GB, o que pelo menos corresponde ao que a própria placa-mãe está relatando.)

# dmidecode --type memory
# dmidecode 2.9
SMBIOS 2.7 present.

Handle 0x0026, DMI type 16, 23 bytes
Physical Memory Array
        Location: System Board Or Motherboard
        Use: System Memory
        Error Correction Type: Multi-bit ECC
        Maximum Capacity: 32 GB
        Error Information Handle: Not Provided
        Number Of Devices: 4

Handle 0x0028, DMI type 17, 34 bytes
Memory Device
        Array Handle: 0x0026
        Error Information Handle: Not Provided
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM0
        Bank Locator: BANK0
        Type: <OUT OF SPEC>
        Type Detail: Synchronous
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer0
        Serial Number: SerNum0
        Asset Tag: AssetTagNum0
        Part Number: Array1_PartNumber0

Handle 0x002A, DMI type 17, 34 bytes
Memory Device
        Array Handle: 0x0026
        Error Information Handle: Not Provided
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM1
        Bank Locator: BANK1
        Type: <OUT OF SPEC>
        Type Detail: Synchronous
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer1
        Serial Number: SerNum1
        Asset Tag: AssetTagNum1
        Part Number: Array1_PartNumber1

Handle 0x002C, DMI type 17, 34 bytes
Memory Device
        Array Handle: 0x0026
        Error Information Handle: Not Provided
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 8192 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM2
        Bank Locator: BANK2
        Type: <OUT OF SPEC>
        Type Detail: Synchronous
        Speed: 1333 MHz (0.8 ns)
        Manufacturer: Manufacturer2
        Serial Number: SerNum2
        Asset Tag: AssetTagNum2
        Part Number: Array1_PartNumber2

Handle 0x002E, DMI type 17, 34 bytes
Memory Device
        Array Handle: 0x0026
        Error Information Handle: Not Provided
        Total Width: Unknown
        Data Width: 64 bits
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM3
        Bank Locator: BANK3
        Type: Unknown
        Type Detail: Synchronous
        Speed: Unknown
        Manufacturer: Manufacturer3
        Serial Number: SerNum3
        Asset Tag: AssetTagNum3
        Part Number: Array1_PartNumber3
#
======================================================================
# cat /proc/meminfo
MemTotal:        3056820 kB
MemFree:         1470820 kB
Buffers:          390204 kB
Cached:           194660 kB
SwapCached:            0 kB
Active:           488024 kB
Inactive:         419096 kB
Active(anon):     231112 kB
Inactive(anon):    96660 kB
Active(file):     256912 kB
Inactive(file):   322436 kB
Unevictable:           0 kB
Mlocked:               0 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:                 8 kB
Writeback:             0 kB
AnonPages:        322320 kB
Mapped:            33012 kB
Shmem:              5472 kB
Slab:             613952 kB
SReclaimable:     597404 kB
SUnreclaim:        16548 kB
KernelStack:        2384 kB
PageTables:        19472 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:     1528408 kB
Committed_AS:     621464 kB
VmallocTotal:   34359738367 kB
VmallocUsed:      294484 kB
VmallocChunk:   34359429080 kB
HardwareCorrupted:     0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
DirectMap4k:        9216 kB
DirectMap2M:     2054144 kB
DirectMap1G:     1048576 kB
#
======================================================================
# dmesg | grep -i memory
[    0.000000] WARNING: BIOS bug: CPU MTRRs don't cover all of memory, losing 13295MB of RAM.
[    0.000000] WARNING: at /tmp/buildd/linux-2.6-2.6.32/debian/build/source_amd64_none/arch/x86/kernel/cpu/mtrr/cleanup.c:1092 mtrr_trim_uncached_memory+0x2e6/0x311()
[    0.000000]  [<ffffffff814f7f1e>] ? mtrr_trim_uncached_memory+0x2e6/0x311
[    0.000000]  [<ffffffff814f7f1e>] ? mtrr_trim_uncached_memory+0x2e6/0x311
[    0.000000]  [<ffffffff814f7f1e>] ? mtrr_trim_uncached_memory+0x2e6/0x311
[    0.000000] initial memory mapped : 0 - 20000000
[    0.000000] init_memory_mapping: 0000000000000000-00000000bdf00000
[    0.000000] PM: Registered nosave memory: 000000000009d000 - 000000000009e000
[    0.000000] PM: Registered nosave memory: 000000000009e000 - 00000000000a0000
[    0.000000] PM: Registered nosave memory: 00000000000a0000 - 00000000000e0000
[    0.000000] PM: Registered nosave memory: 00000000000e0000 - 0000000000100000
[    0.000000] PM: Registered nosave memory: 00000000bd94d000 - 00000000bd99c000
[    0.000000] PM: Registered nosave memory: 00000000bd99c000 - 00000000bd9a6000
[    0.000000] PM: Registered nosave memory: 00000000bd9a6000 - 00000000bdade000
[    0.000000] PM: Registered nosave memory: 00000000bdade000 - 00000000bdaef000
[    0.000000] PM: Registered nosave memory: 00000000bdaef000 - 00000000bdb02000
[    0.000000] PM: Registered nosave memory: 00000000bdb02000 - 00000000bdb04000
[    0.000000] PM: Registered nosave memory: 00000000bdb04000 - 00000000bdb0d000
[    0.000000] PM: Registered nosave memory: 00000000bdb0d000 - 00000000bdb13000
[    0.000000] PM: Registered nosave memory: 00000000bdb13000 - 00000000bdb75000
[    0.000000] PM: Registered nosave memory: 00000000bdb75000 - 00000000bdd78000
[    0.000000] Memory: 3046732k/3111936k available (3075k kernel code, 4728k absent, 60476k reserved, 1879k data, 584k init)
[    1.636730] Freeing initrd memory: 9501k freed
[    1.647370] Freeing unused kernel memory: 584k freed
[    4.876602] [TTM] Zone  kernel: Available graphics memory: 1528410 kiB.
[    4.876615] [drm] radeon: 256M of VRAM memory ready
[    4.876617] [drm] radeon: 512M of GTT memory ready.
[   25.571018] VBoxDrv: dbg - g_abExecMemory=ffffffffa051d6c0
#

Grepping para e820 mostra vários intervalos, terminando com e820 update range: 00000000bdf00000 - 000000043f000000 (usable) ==> (reserved). 43f000000 é 16 GiB, bdf00000 é 3.039 MiB. Eu façonãoveja que isso é coincidência.

# dmesg | grep -i e820
[    0.000000]  BIOS-e820: 0000000000000000 - 000000000009d800 (usable)
[    0.000000]  BIOS-e820: 000000000009d800 - 00000000000a0000 (reserved)
[    0.000000]  BIOS-e820: 00000000000e0000 - 0000000000100000 (reserved)
[    0.000000]  BIOS-e820: 0000000000100000 - 00000000bd94d000 (usable)
[    0.000000]  BIOS-e820: 00000000bd94d000 - 00000000bd99c000 (ACPI NVS)
[    0.000000]  BIOS-e820: 00000000bd99c000 - 00000000bd9a6000 (ACPI data)
[    0.000000]  BIOS-e820: 00000000bd9a6000 - 00000000bdade000 (reserved)
[    0.000000]  BIOS-e820: 00000000bdade000 - 00000000bdaef000 (ACPI NVS)
[    0.000000]  BIOS-e820: 00000000bdaef000 - 00000000bdb02000 (reserved)
[    0.000000]  BIOS-e820: 00000000bdb02000 - 00000000bdb04000 (ACPI NVS)
[    0.000000]  BIOS-e820: 00000000bdb04000 - 00000000bdb0d000 (reserved)
[    0.000000]  BIOS-e820: 00000000bdb0d000 - 00000000bdb13000 (ACPI NVS)
[    0.000000]  BIOS-e820: 00000000bdb13000 - 00000000bdb75000 (reserved)
[    0.000000]  BIOS-e820: 00000000bdb75000 - 00000000bdd78000 (ACPI NVS)
[    0.000000]  BIOS-e820: 00000000bdd78000 - 00000000bdf00000 (usable)
[    0.000000]  BIOS-e820: 00000000fec00000 - 00000000fec01000 (reserved)
[    0.000000]  BIOS-e820: 00000000fec10000 - 00000000fec11000 (reserved)
[    0.000000]  BIOS-e820: 00000000fec20000 - 00000000fec21000 (reserved)
[    0.000000]  BIOS-e820: 00000000fed00000 - 00000000fed01000 (reserved)
[    0.000000]  BIOS-e820: 00000000fed61000 - 00000000fed71000 (reserved)
[    0.000000]  BIOS-e820: 00000000fed80000 - 00000000fed90000 (reserved)
[    0.000000]  BIOS-e820: 00000000fef00000 - 0000000100000000 (reserved)
[    0.000000]  BIOS-e820: 0000000100001000 - 000000043f000000 (usable)
[    0.000000] e820 update range: 0000000000000000 - 0000000000010000 (usable) ==> (reserved)
[    0.000000] e820 update range: 00000000bdf00000 - 000000043f000000 (usable) ==> (reserved)
[    0.000000] update e820 for mtrr
# 

EDITAR 3/4 - sucesso parcial:

  • Atualizar o UEFI BIOS de uma versão 0705 x64 08/23/2011para outra 1007 02/10/2012não ajudou: exatamente o mesmo problema permaneceu.
  • A remoção de um módulo DIMM (eu adivinhei qual slot era o número 4: o mais distante da CPU) permitiu que o BIOS detectasse e usasse os 24 GB restantes, embora uma configuração de três DIMM não seja "recomendada" de acordo com o diagrama no manual do usuário. Notavelmente, colocar um dos DIMMs restantes no slot 4 ainda permitiu que ele fosse usado, portanto o slot está bom. Reinstalar o DIMM "original" naquele slot me trouxe de volta ao ponto de partida.
  • Inicializando a partir do CD de instalação do Debian 6.0.3 AMD64 em um ambiente de resgate e verificando sua dmesgsaída mostranenhum erro MTRR semelhante. Além disso, nesse ambiente, com 3 x 8 GB instalados, 24 GB (mais ou menos épsilon vezes pi ou algo assim; não fiz as contas exatas) aparecem como utilizáveis ​​de acordo com free.
  • Atualizar/reinstalar o kernel (havia uma pequena atualização disponível) parece ter corrigido os problemas do MTRR também. dmesgagora relata um total de 26198016 KB e nenhum erro de MTRR, o que está de acordo com o que eu esperaria com 3 x 8 GB instalados. free -magora relata 24.114 MB de RAM total, o que, francamente, é próximo o suficiente para mim.

Isso cheira a um DIMM vomitado, além de um kernel que por algum motivo foi danificado; esse últimopoderiaaconteceram durante a queda de energia (embora deva dizer que é uma maneira estranha de o kernel quebrar!). O DIMM que não funciona retornará ao revendedor assim que eu falar com ele (espero que amanhã).

(espero) EDIÇÃO FINAL

Fiz RMA em um dos dois pares de DIMMs, ele foi aceito pelo revendedor como danificado e eles me enviaram um novo par, que parece funcionar muito bem. Então agora estou basicamente onde pretendia originalmente há quase um mês (embora uma grande fração desse tempo não tenha sido realmente devido ao revendedor), com 32 GB de RAM utilizáveis; free -mrelata 32.194 MB de memória total e o kernel relata 34586624kRAM na inicialização, ambos alinhados com minhas expectativas.

Responder1

Primeiro, se o seu BIOS/UEFI não detectar corretamente a sua RAM, o seu sistema operacional não terá um desempenho melhor. Não há necessidade de prosseguir se o BIOS exibir informações incorretas sobre sua configuração.

=> Você provavelmente jápelo menosum problema de hardware.

EDITAR: Do seu dmesg | memória grep, parece que você temna verdadeum problema de hardware, localizado na BIOS incorporada. Pelo menos, o Linux detectou e avisa sobre isso WARNING: BIOS bug: CPU MTRRs don't cover all of memory, losing 13295MB of RAM:. Parece também que um dos seus 4 módulos de RAM foi reconhecido ou inserido incorretamente.

Você pode reportar isso ao fabricante, atualizar seu BIOS e trocar sua placa-mãe. Há muitas chances de que, com menos RAM, você não encontre esse bug.

Como observação lateral, você pode concordar com esta famosa citação deLinus Torvalds sobre fabricantes de BIOS:

Os escritores de BIOS são invariavelmente macacos totalmente incompetentes e viciados em crack

Segundo, quando seu BIOS estiver de acordo com o que você realmente tem em sua placa-mãe, você pode dar uma olhada no Linux em /proc/meminfo. Muitas vezes é muito claro o que o seu sistema Linux sabe e faz com a sua memória. Aqui está o que tenho em meus 64 bits/8 Gb de RAM:

$ cat /proc/meminfo 
MemTotal:        8175652 kB
MemFree:         5476336 kB
Buffers:           63924 kB
Cached:          1943460 kB
SwapCached:            0 kB
[...]

Sobre o processo de inicialização e o que é usado/liberado pelo kernel do Linux, você pode fazer o grep em dmesg:

$ dmesg | grep Memory
[    0.000000] Memory: 8157672k/8904704k available (6138k kernel code, 534168k absent, 212864k reserved, 6896k data, 988k init)

EDITAR: Como disse Gilles, com dmidecode --type memoryvocê pode obter detalhes sobre a configuração do seu hardware. É assim para um sistema 4x2Gb:

$ sudo dmidecode --type memory
# dmidecode 2.9
SMBIOS 2.6 present.

Handle 0x0020, DMI type 16, 15 bytes
Physical Memory Array
    Location: System Board Or Motherboard
    Use: System Memory
    Error Correction Type: None
    Maximum Capacity: 32 GB
    Error Information Handle: Not Provided
    Number Of Devices: 4

Handle 0x0022, DMI type 17, 28 bytes
Memory Device
    Array Handle: 0x0020
    Error Information Handle: Not Provided
    Total Width: 64 bits
    Data Width: 64 bits
    Size: 2048 MB
    [...]
[This block is repeated for each module]

Responder2

Pesquise /var/log/dmesg pelo mapa de memória (grep para 'e820') e conte quantas memórias são relatadas como utilizáveis. Isto é o que o BIOS informa ao sistema operacional carregado para obter memória.

(Isso é correto apenas para inicialização no estilo antigo. Não sei como a memória é relatada se a inicialização no estilo EFI for usada, mas acho que há um relatório semelhante.)

Além disso, relatar 16 GB pelo BIOS enquanto 32 GB estão instalados significa alguma estranheza na configuração da memória. Tente reduzir a memória instalada para 4 ou 8 GB e compare os efeitos.

Responder3

Muitas placas AMD mais antigas podem ter 4 slots, mas se você preencher o último slot, terá problemas. É um problema de chipset que não pode ser corrigido.

informação relacionada