NVMe-SSD wurde plötzlich unpraktisch langsam (sowohl Lesen als auch Schreiben)

NVMe-SSD wurde plötzlich unpraktisch langsam (sowohl Lesen als auch Schreiben)

Aktualisierung 1: Ich habe diesen Server in einem anderen Ubuntu (ebenfalls 20.04 LTS) neu gestartet, das auf der Festplatte installiert ist, und hdparm -tTes zeigt eine angemessene Leistung von über 1 GB/s. Jetzt neige ich dazu zu glauben, dass es ein Softwareproblem ist – die SSD selbst sollte in Ordnung sein.

Aktualisierung 2: Verwirrenderweise zeigt es keine ungewöhnliche Festplattenaktivität, obwohl die Festplatte immer noch „sehr aktiv“ ist. Ab und zu tauchen zufällig atopviele Threads auf.z_wr_iss

oben auf


Das ist eine HP SSD EX920 1TB, die auf einem Desktop-Computer installiert ist, der rund um die Uhr als persönlicher Server läuft. Sie hat über ein Jahr lang gut funktioniert und erst letzte Woche,plötzlich, Prozesse begannen zufällig in den Ruhezustand (D) zu wechseln (unterbrechungsfreier Schlaf). Dieses Laufwerk ist nur halb voll und wird regelmäßig getrimmt.

Die Testergebnisse von HDparm sind lächerlich ( /dev/nvme0ist die fragliche SSD, /dev/sdaist es eine andere Festplatte) (Klären: Das HDparm-Programm ist in Ordnung und weist keine Fehlfunktion auf, die SSD selbst weist eine falsche Leistung von nur wenigen MB/s auf):

root@ubuntu:~# hdparm -Tt /dev/nvme0n1
/dev/nvme0n1:
 Timing cached reads:   15670 MB in  2.00 seconds = 7839.79 MB/sec
 HDIO_DRIVE_CMD(identify) failed: Inappropriate ioctl for device
 Timing buffered disk reads:   8 MB in  3.61 seconds =   2.22 MB/sec

root@ubuntu:~# hdparm -Tt /dev/sda
/dev/sda:
 Timing cached reads:   29014 MB in  2.00 seconds = 14525.03 MB/sec
 Timing buffered disk reads: 454 MB in  3.01 seconds = 150.67 MB/sec

Die SMART-Informationen sehen jedoch in Ordnung aus:

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-56-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       HP SSD EX920 1TB
Serial Number:                      xxxxxxxxxxxxxxx
Firmware Version:                   SVN139B
PCI Vendor ID:                      0x1dee
PCI Vendor Subsystem ID:            0x126f
IEEE OUI Identifier:                0x000000
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          1,024,209,543,168 [1.02 TB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Mon Dec  7 13:54:15 2020 CST
Firmware Updates (0x14):            2 Slots, no Reset required
Optional Admin Commands (0x0016):   Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size:         64 Pages
Warning  Comp. Temp. Threshold:     70 Celsius
Critical Comp. Temp. Threshold:     80 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     9.00W       -        -    0  0  0  0        0       0
 1 +     4.60W       -        -    1  1  1  1        0       0
 2 +     3.80W       -        -    2  2  2  2        0       0
 3 -   0.0450W       -        -    3  3  3  3     2000    2000
 4 -   0.0040W       -        -    4  4  4  4     6000    8000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        54 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    31,682,199 [16.2 TB]
Data Units Written:                 50,028,403 [25.6 TB]
Host Read Commands:                 538,395,033
Host Write Commands:                1,279,795,487
Controller Busy Time:               20,480
Power Cycles:                       1,012
Power On Hours:                     7,879
Unsafe Shutdowns:                   40
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    7
Critical Comp. Temperature Time:    0
Thermal Temp. 1 Transition Count:   8
Thermal Temp. 2 Transition Count:   2
Thermal Temp. 1 Total Time:         1118
Thermal Temp. 2 Total Time:         214

Error Information (NVMe Log 0x01, max 256 entries)
No Errors Logged

hdparm -BBeim Versuch, auf APM-Informationen ( ) dieser NVMe-SSD zuzugreifen, wird nur die Meldung „Unangemessenes ioctl für Gerät“ angezeigt.

Darüber hinaus habe ichnichtkeine beschädigten Daten entdeckt (alle intakt), nur unangemessen langsame Lese-/Schreibgeschwindigkeiten.

Das Laufwerk hat drei Partitionen: eine EFI-Systempartition (einige hundert MiB), eine ext4-Partition als Root-Dateisystem (128 GiB) und der Rest geht an ZFS. Die Ausführung hdparm -tTauf einzelnen Partitionen führt zu ähnlichen Ergebnissen (weniger als 10 MB/s Lesegeschwindigkeit). Alle diese Partitionen sind auf 1-MiB-Grenzen ausgerichtet.

Was muss ich als Nächstes tun, um die „normale“ Geschwindigkeit dieser SSD wiederherzustellen? Oder muss ich mir ein Ersatzteil besorgen?

Antwort1

Es handelt sich um ein NVMe-Laufwerk. Sie müssen wahrscheinlich NVMe-CLI installieren, um die APM-Einstellungen und den Grund zu überprüfen, warum ioctl nicht funktioniert hat. Die z_wr_iss-Threads sind die Schreibthreads von ZFS unter Linux. Diese gepufferten Lesevorgänge sind sehr langsam. Vielleicht ist der Speicher Ihres Systems langsam? Oder es könnte sich um ein ZFS-Optimierungsproblem handeln.

verwandte Informationen