Aktualisierung 1: Ich habe diesen Server in einem anderen Ubuntu (ebenfalls 20.04 LTS) neu gestartet, das auf der Festplatte installiert ist, und hdparm -tT
es zeigt eine angemessene Leistung von über 1 GB/s. Jetzt neige ich dazu zu glauben, dass es ein Softwareproblem ist – die SSD selbst sollte in Ordnung sein.
Aktualisierung 2: Verwirrenderweise zeigt es keine ungewöhnliche Festplattenaktivität, obwohl die Festplatte immer noch „sehr aktiv“ ist. Ab und zu tauchen zufällig atop
viele Threads auf.z_wr_iss
Das ist eine HP SSD EX920 1TB, die auf einem Desktop-Computer installiert ist, der rund um die Uhr als persönlicher Server läuft. Sie hat über ein Jahr lang gut funktioniert und erst letzte Woche,plötzlich, Prozesse begannen zufällig in den Ruhezustand (D) zu wechseln (unterbrechungsfreier Schlaf). Dieses Laufwerk ist nur halb voll und wird regelmäßig getrimmt.
Die Testergebnisse von HDparm sind lächerlich ( /dev/nvme0
ist die fragliche SSD, /dev/sda
ist es eine andere Festplatte) (Klären: Das HDparm-Programm ist in Ordnung und weist keine Fehlfunktion auf, die SSD selbst weist eine falsche Leistung von nur wenigen MB/s auf):
root@ubuntu:~# hdparm -Tt /dev/nvme0n1
/dev/nvme0n1:
Timing cached reads: 15670 MB in 2.00 seconds = 7839.79 MB/sec
HDIO_DRIVE_CMD(identify) failed: Inappropriate ioctl for device
Timing buffered disk reads: 8 MB in 3.61 seconds = 2.22 MB/sec
root@ubuntu:~# hdparm -Tt /dev/sda
/dev/sda:
Timing cached reads: 29014 MB in 2.00 seconds = 14525.03 MB/sec
Timing buffered disk reads: 454 MB in 3.01 seconds = 150.67 MB/sec
Die SMART-Informationen sehen jedoch in Ordnung aus:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-56-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Number: HP SSD EX920 1TB
Serial Number: xxxxxxxxxxxxxxx
Firmware Version: SVN139B
PCI Vendor ID: 0x1dee
PCI Vendor Subsystem ID: 0x126f
IEEE OUI Identifier: 0x000000
Controller ID: 1
Number of Namespaces: 1
Namespace 1 Size/Capacity: 1,024,209,543,168 [1.02 TB]
Namespace 1 Formatted LBA Size: 512
Local Time is: Mon Dec 7 13:54:15 2020 CST
Firmware Updates (0x14): 2 Slots, no Reset required
Optional Admin Commands (0x0016): Format Frmw_DL Self_Test
Optional NVM Commands (0x005f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Maximum Data Transfer Size: 64 Pages
Warning Comp. Temp. Threshold: 70 Celsius
Critical Comp. Temp. Threshold: 80 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 9.00W - - 0 0 0 0 0 0
1 + 4.60W - - 1 1 1 1 0 0
2 + 3.80W - - 2 2 2 2 0 0
3 - 0.0450W - - 3 3 3 3 2000 2000
4 - 0.0040W - - 4 4 4 4 6000 8000
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 54 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 31,682,199 [16.2 TB]
Data Units Written: 50,028,403 [25.6 TB]
Host Read Commands: 538,395,033
Host Write Commands: 1,279,795,487
Controller Busy Time: 20,480
Power Cycles: 1,012
Power On Hours: 7,879
Unsafe Shutdowns: 40
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 7
Critical Comp. Temperature Time: 0
Thermal Temp. 1 Transition Count: 8
Thermal Temp. 2 Transition Count: 2
Thermal Temp. 1 Total Time: 1118
Thermal Temp. 2 Total Time: 214
Error Information (NVMe Log 0x01, max 256 entries)
No Errors Logged
hdparm -B
Beim Versuch, auf APM-Informationen ( ) dieser NVMe-SSD zuzugreifen, wird nur die Meldung „Unangemessenes ioctl für Gerät“ angezeigt.
Darüber hinaus habe ichnichtkeine beschädigten Daten entdeckt (alle intakt), nur unangemessen langsame Lese-/Schreibgeschwindigkeiten.
Das Laufwerk hat drei Partitionen: eine EFI-Systempartition (einige hundert MiB), eine ext4-Partition als Root-Dateisystem (128 GiB) und der Rest geht an ZFS. Die Ausführung hdparm -tT
auf einzelnen Partitionen führt zu ähnlichen Ergebnissen (weniger als 10 MB/s Lesegeschwindigkeit). Alle diese Partitionen sind auf 1-MiB-Grenzen ausgerichtet.
Was muss ich als Nächstes tun, um die „normale“ Geschwindigkeit dieser SSD wiederherzustellen? Oder muss ich mir ein Ersatzteil besorgen?
Antwort1
Es handelt sich um ein NVMe-Laufwerk. Sie müssen wahrscheinlich NVMe-CLI installieren, um die APM-Einstellungen und den Grund zu überprüfen, warum ioctl nicht funktioniert hat. Die z_wr_iss-Threads sind die Schreibthreads von ZFS unter Linux. Diese gepufferten Lesevorgänge sind sehr langsam. Vielleicht ist der Speicher Ihres Systems langsam? Oder es könnte sich um ein ZFS-Optimierungsproblem handeln.