"Arreglar"

"Arreglar"

Tengo un problema con el sistema operativo. Todas las herramientas, incluido el kernel, muestran solo la mitad de mi memoria RAM real. Tengo un chip de memoria de 16G instalado en mi computadora portátil y todo se muestra bien en BIOS.

Alguna información sobre la configuración:

HW

Un portátil Dell XPS 15 9550 (enlace pdf), que dice entre otras cosas:

Memoria

Ranuras: Dos ranuras SODIMM

Tipo: DDR4

Velocidad: 2133MHz

Configuraciones admitidas: 8 GB, 16 GB y 32 GB

UPC

Procesador Intel® Core™ i7-6700HQ (enlace arca), que dice entre otras cosas:

Tamaño máximo de memoria (dependiendo del tipo de memoria): 64 GB

Tipos de memoria: DDR4-2133, LPDDR3-1866, DDR3L-1600

Información del sistema

# dmidecode 3.2
Getting SMBIOS data from sysfs.
SMBIOS 2.8 present.
90 structures occupying 5605 bytes.
Table at 0x000E8C20.

Handle 0x0000, DMI type 0, 24 bytes
BIOS Information
        Vendor: Dell Inc.
        Version: 1.14.0
        Release Date: 02/13/2020
        Address: 0xF0000
        Runtime Size: 64 kB
        ROM Size: 16 MB
        Characteristics:
                PCI is supported
                PNP is supported
                BIOS is upgradeable
                BIOS shadowing is allowed
                Boot from CD is supported
                Selectable boot is supported
                EDD is supported
                5.25"/1.2 MB floppy services are supported (int 13h)
                3.5"/720 kB floppy services are supported (int 13h)
                3.5"/2.88 MB floppy services are supported (int 13h)
                Print screen service is supported (int 5h)
                8042 keyboard services are supported (int 9h)
                Serial services are supported (int 14h)
                Printer services are supported (int 17h)
                ACPI is supported
                USB legacy is supported
                Smart battery is supported
                BIOS boot specification is supported
                Function key-initiated network boot is supported
                Targeted content distribution is supported
                UEFI is supported
        BIOS Revision: 1.14

Handle 0x0001, DMI type 1, 27 bytes
System Information
        Manufacturer: Dell Inc.
        Product Name: XPS 15 9550
        Version: Not Specified
        Serial Number: GR1RD72
        UUID: 4c4c4544-0052-3110-8052-c7c04f443732
        Wake-up Type: Power Switch
        SKU Number: 06E4
        Family: XPS

Núcleo

$ uname -a
Linux piotr-XPS-15-9550 5.11.0-22-generic #23~20.04.1-Ubuntu SMP Thu Jun 17 12:51:00 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux

Memoria mostrada porfree

$ free -h
              total        used        free      shared  buff/cache   available
Mem:          7,0Gi       2,6Gi       1,1Gi       887Mi       3,4Gi       3,3Gi
Swap:         979Mi          0B       979Mi

Memoria mostrada por /proc/meminfo:

$ cat /proc/meminfo 
MemTotal:        7382044 kB
MemFree:         1142512 kB
MemAvailable:    3467104 kB
Buffers:          201548 kB
Cached:          3183760 kB
SwapCached:            0 kB
Active:           823272 kB
Inactive:        4182420 kB
Active(anon):       1924 kB
Inactive(anon):  2520488 kB
Active(file):     821348 kB
Inactive(file):  1661932 kB
Unevictable:      831044 kB
Mlocked:              32 kB
SwapTotal:       1003516 kB
SwapFree:        1003516 kB
Dirty:               104 kB
Writeback:             0 kB
AnonPages:       2451456 kB
Mapped:           842608 kB
Shmem:            908320 kB
KReclaimable:     137292 kB
Slab:             238076 kB
SReclaimable:     137292 kB
SUnreclaim:       100784 kB
KernelStack:       19088 kB
PageTables:        36676 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:     4694536 kB
Committed_AS:    9487844 kB
VmallocTotal:   34359738367 kB
VmallocUsed:       76280 kB
VmallocChunk:          0 kB
Percpu:             6176 kB
HardwareCorrupted:     0 kB
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
ShmemPmdMapped:        0 kB
FileHugePages:         0 kB
FilePmdMapped:         0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
Hugetlb:               0 kB
DirectMap4k:      328276 kB
DirectMap2M:     6234112 kB
DirectMap1G:     2097152 kB

Memoria mostrada pordmidecode

$ sudo dmidecode -t memory
# dmidecode 3.2
Getting SMBIOS data from sysfs.
SMBIOS 2.8 present.

Handle 0x0038, DMI type 16, 23 bytes
Physical Memory Array
        Location: System Board Or Motherboard
        Use: System Memory
        Error Correction Type: None
        Maximum Capacity: 32 GB
        Error Information Handle: Not Provided
        Number Of Devices: 2

Handle 0x0039, DMI type 17, 40 bytes
Memory Device
        Array Handle: 0x0038
        Error Information Handle: Not Provided
        Total Width: 64 bits
        Data Width: 64 bits
        Size: 16384 MB
        Form Factor: SODIMM
        Set: None
        Locator: DIMM A
        Bank Locator: DIMM A
        Type: DDR4
        Type Detail: Synchronous
        Speed: 2133 MT/s
        Manufacturer: 0793
        Serial Number: 12161215
        Asset Tag: 16360000
        Part Number: GR2133S464L15/16G   
        Rank: 2
        Configured Memory Speed: 2133 MT/s
        Minimum Voltage: Unknown
        Maximum Voltage: Unknown
        Configured Voltage: 1.2 V

Handle 0x003A, DMI type 17, 40 bytes
Memory Device
        Array Handle: 0x0038
        Error Information Handle: Not Provided
        Total Width: Unknown
        Data Width: Unknown
        Size: No Module Installed
        Form Factor: DIMM
        Set: None
        Locator: DIMM B
        Bank Locator: DIMM B
        Type: Unknown
        Type Detail: None
        Speed: Unknown
        Manufacturer: Not Specified
        Serial Number: Not Specified
        Asset Tag: Not Specified
        Part Number: Not Specified
        Rank: Unknown
        Configured Memory Speed: Unknown
        Minimum Voltage: Unknown
        Maximum Voltage: Unknown
        Configured Voltage: Unknown

Salida de dmesg:

$ dmesg | grep -i e820
[    0.000000] BIOS-e820: [mem 0x0000000000000000-0x000000000009dbff] usable
[    0.000000] BIOS-e820: [mem 0x000000000009dc00-0x000000000009ffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
[    0.000000] BIOS-e820: [mem 0x0000000000100000-0x0000000032667fff] usable
[    0.000000] BIOS-e820: [mem 0x0000000032668000-0x0000000032668fff] ACPI NVS
[    0.000000] BIOS-e820: [mem 0x0000000032669000-0x0000000036fcefff] reserved
[    0.000000] BIOS-e820: [mem 0x0000000036fcf000-0x000000003700cfff] ACPI data
[    0.000000] BIOS-e820: [mem 0x000000003700d000-0x0000000037674fff] ACPI NVS
[    0.000000] BIOS-e820: [mem 0x0000000037675000-0x000000003fffffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000e0000000-0x00000000efffffff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000fe000000-0x00000000fe010fff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000fec00000-0x00000000fec00fff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000fee00000-0x00000000fee00fff] reserved
[    0.000000] BIOS-e820: [mem 0x00000000ff000000-0x00000000ffffffff] reserved
[    0.000000] BIOS-e820: [mem 0x0000000100000000-0x000000029e22cfff] usable
[    0.000000] BIOS-e820: [mem 0x000000029e22d000-0x00000004bdffffff] reserved
[    0.000767] e820: update [mem 0x00000000-0x00000fff] usable ==> reserved
[    0.000771] e820: remove [mem 0x000a0000-0x000fffff] usable
[    0.123701] PCI: MMCONFIG at [mem 0xe0000000-0xefffffff] reserved in E820
[    0.333546] e820: reserve RAM buffer [mem 0x0009dc00-0x0009ffff]
[    0.333548] e820: reserve RAM buffer [mem 0x32668000-0x33ffffff]
[    0.333549] e820: reserve RAM buffer [mem 0x29e22d000-0x29fffffff]

Salida completa de dmesg:https://pastebin.com/B7qLzVvK

Sistema operativo: Linux Mint 20 Ulyana

Lo que hice antes de publicar aquí:

  1. Bios actualizada a la versión más reciente.
  2. Memtest86 usado y herramienta de diagnóstico de Dell: todo bien, la BIOS muestra 16G
  3. Kernel actualizado a 5.11
  4. Probé Ubuntu 20.04 desde una unidad USB y muestra 16G de RAM en la aplicación de monitor del sistema (de alguna manera no pude escribir ningún carácter en la consola integrada en el teclado o desde el USB :/)

¿Podría ser porque no uso UEFI para arrancar?

¿Qué puedo hacer para depurar y solucionar este problema? Gracias.

//EDITAR

$ decode-dimms                                                                                                                                              
# decode-dimms version $Revision$

Memory Serial Presence Detect Decoder
By Philip Edelbrock, Christian Zuckschwerdt, Burkart Lingner,
Jean Delvare, Trent Piepho and others


Decoding EEPROM: /sys/bus/i2c/drivers/ee1004/0-0050
Guessing DIMM is in                              bank 1

---=== SPD EEPROM Information ===---
EEPROM CRC of bytes 0-125                        OK (0xEF1D)
# of bytes written to SDRAM EEPROM               384
Total number of bytes in EEPROM                  512
Fundamental Memory type                          DDR4 SDRAM
SPD Revision                                     1.0
Module Type                                      SO-DIMM
EEPROM CRC of bytes 128-253                      OK (0x2355)

---=== Memory Characteristics ===---
Maximum module speed                             2132 MHz (PC4-17000)
Size                                             16384 MB
Banks x Rows x Columns x Bits                    16 x 16 x 10 x 64
SDRAM Device Width                               8 bits
Ranks                                            2
Rank Mix                                         Symmetrical
AA-RCD-RP-RAS (cycles)                           15-15-15-36
Supported CAS Latencies                          16T, 15T, 14T, 13T, 12T, 11T, 10T

---=== Timings at Standard Speeds ===---
AA-RCD-RP-RAS (cycles) as DDR4-1866              13-13-13-31
AA-RCD-RP-RAS (cycles) as DDR4-1600              11-11-11-27

---=== Timing Parameters ===---
Minimum Cycle Time (tCKmin)                      0.938 ns
Maximum Cycle Time (tCKmax)                      1.500 ns
Minimum CAS Latency Time (tAA)                   13.750 ns
Minimum RAS to CAS Delay (tRCD)                  13.750 ns
Minimum Row Precharge Delay (tRP)                13.750 ns
Minimum Active to Precharge Delay (tRAS)         33.000 ns
Minimum Active to Auto-Refresh Delay (tRC)       46.750 ns
Minimum Recovery Delay (tRFC1)                   350.000 ns
Minimum Recovery Delay (tRFC2)                   260.000 ns
Minimum Recovery Delay (tRFC4)                   160.000 ns
Minimum Four Activate Window Delay (tFAW)        21.000 ns
Minimum Row Active to Row Active Delay (tRRD_S)  3.700 ns
Minimum Row Active to Row Active Delay (tRRD_L)  5.300 ns
Minimum CAS to CAS Delay (tCCD_L)                5.625 ns

---=== Other Information ===---
Package Type                                     Monolithic
Maximum Activate Count                           Unlimited
Post Package Repair                              One row per bank group
Soft PPR                                         Not Supported
Module Nominal Voltage                           1.2 V
Thermal Sensor                                   No

---=== Physical Characteristics ===---
Module Height                                    30 mm
Module Thickness                                 2 mm front, 2 mm back
Module Reference Card                            E revision 1

---=== Manufacturer Data ===---
Module Manufacturer                              Wilk Elektronik S.A.
Manufacturing Date                               2017-W06
Part Number                                      GR2133S464L15/16G   


Number of SDRAM DIMMs detected and decoded: 1

Ejecuté dmesg nuevamente e hice algunos cálculos sobre esta memoria usada/reservada. Espero que sean correctos pero parecen más menos correctos:

$ dmesg | grep 'BIOS-e820: \[mem' | sed -r 's/.*mem (0x.*)-(0x.*)\] (.*)/\1|\2|\3/g' | awk -F '|' '{printf "%10s %15.2f MB\n", $3, (strtonum($2) - strtonum($1)) / 1024/1024 }'
    usable            0.62 MB
  reserved            0.01 MB
  reserved            0.12 MB
    usable          798.46 MB
  ACPI NVS            0.00 MB
  reserved           80.34 MB
 ACPI data            0.24 MB
  ACPI NVS            6.41 MB
  reserved          137.54 MB
  reserved          256.00 MB
  reserved            0.07 MB
  reserved            0.00 MB
  reserved            0.00 MB
  reserved           16.00 MB
    usable         6626.18 MB
  reserved         8701.82 MB

Parece que alrededor de 9G está reservado y no sé por qué...

// EDITAR 2

Ahora se está poniendo súper raro. Hace un momento estaba en el servicio de computadoras portátiles y probamos algunos otros chips de memoria de su propiedad, y el BIOS siempre muestra los valores correctos, pero no Linux:

  • cuando uso mi antiguo 1x16G - El sistema operativo muestra 7G
  • cuando uso mi antiguo 2x16G: el sistema operativo muestra 17G
  • cuando se usa 1x8G desde el servicio: muestra 7G
  • cuando se usa 1x16G desde el servicio: muestra 7G

Esto es simplemente extraño.

// EDITAR 3

Maldita sea. Creo que encontré la causa de mostrar solo la mitad de la memoria.

Descargué la versión USB de Kubuntu 21.04 y lo inicié:

  1. en modo heredado (sin UEFI): muestra la mitad de la memoria
  2. en modo UEFI: muestra toda la memoria

Mi pregunta ahora es ¿por qué?

Respuesta1

Responderé mi propia pregunta ya que finalmente descubrí lo que estaba sucediendo.

TLDR;

Linux informó un máximo de 8 GB por chip de memoria porque estaba usando el arranque heredado. Cuando se utiliza el arranque UEFI, Linux muestra la memoria llena por chip.


Historia completa, tal vez le sirva a alguien.

Compré esta computadora portátil Dell hace algún tiempo. Tenía buenas especificaciones como 32G RAM (2x16G), 4 núcleos i7, 512G SSD, etc. Instalé Linux Mint 19 y funcionó bien la mayor parte del tiempo. Se cobraba como una o dos veces al día cuando había un uso intensivo de aplicaciones como dos ventanas de navegador con múltiples pestañas, tres instancias de IDE, Youtube, videollamadas, etc. al mismo tiempo. Los síntomas parecían problemas gráficos debido a una pantalla "parecida a un televisor roto" cuando fallaba. Sólo un reinicio completo pudo devolverle la vida a la computadora portátil.

Después de algunas fallas, decidí monitorear algunas temperaturas, el uso de la CPU, el uso de la memoria, etc. Esta fue la primera vez que noté que el sistema operativo muestra aproximadamente la mitad de la memoria real que se muestra en el BIOS. Esto sugirió algunos problemas graves de memoria.

Lo interesante dmidecodesiempre muestra valores correctos. También dmesgmuestra que Kerenel sabe acerca de la memoria llena, pero informa que solo es utilizable alrededor de la mitad.

Decidí hacer algunas pruebas en esta computadora portátil y comenzar ejecutando las herramientas de diagnóstico de Dell y memtest86. Ambas herramientas mostraron 32G de RAM y ambas fallaron después de unos minutos de la fase de prueba de memoria. Los mismos síntomas que antes. Estaba 99% seguro de que era un problema de memoria.

Después de esto, probé diferentes configuraciones de chips de memoria y falló solo cuando se insertaron ambos chips de memoria, sin importar en qué ranuras. Parece que ambos están bien (cada chip pasó memtest86) pero no funcionan bien cuando se combinan con hardware de Dell.

Entonces, para solucionar fallas, solo necesitaba usar una sola ranura de memoria.

Los bloqueos desaparecieron, pero el sistema operativo solo informó 8 GB de RAM con 16 GB insertados. Esto fue un problema porque el sistema operativo comenzó a usar swap muy pronto y era bastante inutilizable.

Decidí comprobar algunos chips de memoria completamente diferentes sólo para ver si los informes estaban bien.

  • dos chips antiguos de 16G: informa alrededor de 17G de RAM
  • un chip 8G - informa 8G RAM
  • Chip 16G (diferente a los anteriores): informe 8 GB (¿¡qué diablos!?)

En todas las configuraciones, memtest86 y BIOS muestran la RAM correcta. Entonces este es un problema del sistema operativo. ¿Pero por qué?

Después de la @LinuxSeguridadFreaksugerencia, intenté iniciar Ubuntu Live USB para ver qué se muestra allí. El arranque único de Dell muestra dos opciones de arranque posibles para USB, heredado y UEFI. Probé UEFI por primera vez y la cantidad de RAM era correcta, 16 GB. Luego probé el modo heredado y ¡boom! Sólo 8 GB.

Entonces mi problema fue causado por el sistema operativo instalado sin arranque UEFI. Probablemente apagué UEFI porque tuve algunos problemas con el arranque USB en vivo, pero no estoy seguro.

El mayor misterio para mí es ¿por qué es importante para el kernel del sistema operativo?

"Arreglar"

Para solucionar todo esto, acabo de instalar Kubuntu con UEFI habilitado en BIOS. Ahora la memoria se informa correctamente...

información relacionada