
저는 RAID 1 연결에서 2개의 nvme SSD를 사용하는 서버를 관리하고 있습니다. 어느 시점에서 나는 2개 중 하나에 대한 액세스를 잃었고 mdadm으로부터 정상적인 RAID 배열의 품질이 저하된 메일을 받았습니다.
그래서 호스팅 회사에 확인해 달라고 요청했고 그들은 더 나은 접촉을 만들기 위해 어레이의 접촉부를 청소해야 한다고 말했고 일단 그렇게 하면 기계가 nvme를 선택하고 어레이를 재구축하기 시작했습니다.
재구축이 완료되면 들어가서 결과를 확인했습니다. 따라서 SSD는 새로운 것이 아닙니다. 이는 사용되므로 SMART 판독값에 이를 반영해야 합니다.
내가 달렸을 때 nvme list
다음과 같은 결과를 얻었습니다.
| => nvme list
Node SN Model Namespace Usage Format FW Rev
--------------------- -------------------- ---------------------------------------- --------- -------------------------- ---------------- --------
/dev/nvme0n1 S************1 SAMSUNG MZVKW512HMJP-00000 1 36.70 GB / 512.11 GB 512 B + 0 B CXA7500Q
/dev/nvme1n1 S************5 SAMSUNG MZVL2512HCJQ-00B00 1 511.95 GB / 512.11 GB 512 B + 0 B GXA7801Q
지금은 서버가 꽤 낡았지만 중고로 구해 몇 주 전에 다시 개편했습니다. 그래서 지금은 꽤 비어 있습니다. 멤버 1의 사용 공간은 36.7GB가 맞는 것 같습니다. 두 번째 멤버는 재건축된 멤버입니다. 511.95Gb가 사용되었다고 보고합니다. 이는 raid 1 어레이에서는 의미가 없습니다. (또는 그렇습니까?) 제가 틀렸다면 정정해 주십시오.
내 말은, 시스템이 잘 작동한다는 거죠. 내가 실행할 때 :
| => cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 nvme1n1p1[2] nvme0n1p1[0]
33520640 blocks super 1.2 [2/2] [UU]
md1 : active raid1 nvme1n1p2[2] nvme0n1p2[0]
1046528 blocks super 1.2 [2/2] [UU]
md2 : active raid1 nvme0n1p3[0] nvme1n1p3[1]
465370432 blocks super 1.2 [2/2] [UU]
bitmap: 4/4 pages [16KB], 65536KB chunk
unused devices: <none>
소프트웨어 RAID 어레이가 제대로 작동하는 것을 확인했습니다. 두 드라이브는 동일해야 합니다. 두 번째 nvme에서 511.96Gb 사용량은 무엇을 의미합니까? 정상인가요?
나는 SMARTMONTOOLS가 무엇을 보고할지 보려고 노력했고 다음과 같은 결과를 얻었습니다.
| => smartctl -A /dev/nvme1
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.0-52-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 31 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 0%
Data Units Read: 25,639 [13.1 GB]
Data Units Written: 2,127,320 [1.08 TB]
Host Read Commands: 101,600
Host Write Commands: 8,203,941
Controller Busy Time: 239
Power Cycles: 7
Power On Hours: 26
Unsafe Shutdowns: 3
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 31 Celsius
Temperature Sensor 2: 31 Celsius
(예, 알아요. 전원 켜짐 시간은 26시간입니다. 이 nvme는 새 제품입니다. 호스팅 회사로부터 확인을 받았습니다.)
드라이브의 다른 모든 것은 괜찮아 보입니다. 다른 드라이브는 훨씬 오래되었으며 smarmontools 보고서는 다음과 같습니다.
| => smartctl -A /dev/nvme0
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.0-52-generic] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 27 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 26%
Data Units Read: 115,783,912 [59.2 TB]
Data Units Written: 281,087,251 [143 TB]
Host Read Commands: 1,142,872,239
Host Write Commands: 8,039,604,613
Controller Busy Time: 38,359
Power Cycles: 519
Power On Hours: 16,843
Unsafe Shutdowns: 496
Media and Data Integrity Errors: 0
Error Information Log Entries: 154
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 27 Celsius
Temperature Sensor 2: 33 Celsius
그것도 괜찮고 예상대로인 것 같습니다. 그러나 어떤 이유에서 nvme list
인지 512Gb를 사용하고 있는 것으로 나타났습니다. 어떻게 이런 일이 있을 수 있습니까? 재건축 과정이 제대로 완료되지 않았나요?
어떻게 생각하나요?
답변1
이제 다음과 같은 결과도 얻습니다.
Node SN Model Namespace Usage Format FW Rev
--------------------- -------------------- ---------------------------------------- --------- -------------------------- ---------------- --------
/dev/nvme0n1 S69xxxxxxxxxxxxx Samsung SSD 980 PRO 2TB 1 2.00 TB / 2.00 TB 512 B + 0 B 5B2QGXA7
/dev/nvme1n1 S69xxxxxxxxxxxxx Samsung SSD 980 PRO 2TB 1 381.65 GB / 2.00 TB 512 B + 0 B 5B2QGXA7
그리고 mdstat는 괜찮아 보입니다.
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 nvme0n1p2[1] nvme1n1p2[0]
1952279552 blocks super 1.2 [2/2] [UU]
bitmap: 2/15 pages [8KB], 65536KB chunk
왜 그런지 아는 사람 있나요?