![SSD 교체](https://rvso.com/image/898942/SSD%20%EA%B5%90%EC%B2%B4.png)
내 노트북 SSD문제가 발생하고 오류 수가 급증했습니다.지난번에 제가 포스팅을 했을 때.
이 드라이브가 죽었거나 죽어가고 있습니까?
지금 켜져 있고 이 글을 쓰고 있습니다. 데이터를 모두 백업했지만 사용할 수 있는지 여부는 여전히 확신할 수 없습니다.
제조업체에 문의해도 큰 도움이 되지 않았습니다. Windows를 설치하고 거기에서 디스크 검사 유틸리티를 실행하거나 Windows 호스트에 외장 드라이브로 연결하여 테스트해 보라고 요청했습니다.
두 가지를 모두 수행했는데 오류가 발생하지 않았습니다.
또한 그들이 제공하는 유틸리티를 사용하여 이를 확인했습니다(아래 스크린샷 참조). 그런 다음 clonezilla로 만든 이미지를 사용하여 Ubuntu로 돌아갔고 SATA PHY 오류 수가 300개에 가까워지는 것을 발견했습니다!
커넥터도 확인해 봤는데 SSD가 노트북에 들어있어서 케이블을 (쉽게) 바꿀 수가 없어요.
이는 제조업체의 유틸리티에서 생성된 테스트 결과입니다.
그리고 smartctl
나중에 Ubuntu에서의 출력은 다음과 같습니다.
smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.14.0-041400-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: SPCC Solid State Disk
Serial Number: XXXXXXXXXX
Firmware Version: S9FM02.8
User Capacity: 120,034,123,776 bytes [120 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-3 (minor revision not indicated)
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Sun Feb 18 02:22:56 2018 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 30) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 2) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000a 100 100 000 Old_age Always - 0
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 6352
12 Power_Cycle_Count 0x0012 100 100 000 Old_age Always - 2717
168 Unknown_Attribute 0x0012 100 100 000 Old_age Always - 0
170 Unknown_Attribute 0x0013 100 100 010 Pre-fail Always - 25
173 Unknown_Attribute 0x0000 100 100 000 Old_age Offline - 105447539
192 Power-Off_Retract_Count 0x0012 100 100 000 Old_age Always - 77
194 Temperature_Celsius 0x0023 070 070 000 Pre-fail Always - 30
196 Reallocated_Event_Count 0x0000 100 100 000 Old_age Offline - 0
218 Unknown_Attribute 0x0000 100 100 000 Old_age Offline - 15431
241 Total_LBAs_Written 0x0012 100 100 000 Old_age Always - 6281157
SMART Error Log Version: 1
ATA Error Count: 298 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 298 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:08.077 [VENDOR SPECIFIC]
ca 00 80 b0 8f 12 e1 00 00:11:08.076 WRITE DMA
ca 00 80 30 8f 12 e1 00 00:11:08.076 WRITE DMA
ca 00 80 b0 8e 12 e1 00 00:11:08.075 WRITE DMA
ca 00 80 30 8e 12 e1 00 00:11:08.074 WRITE DMA
Error 297 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:08.039 [VENDOR SPECIFIC]
ca 00 80 b0 7c 12 e1 00 00:11:08.038 WRITE DMA
ca 00 80 30 7c 12 e1 00 00:11:08.038 WRITE DMA
ca 00 80 b0 7b 12 e1 00 00:11:08.037 WRITE DMA
ca 00 80 30 7b 12 e1 00 00:11:08.037 WRITE DMA
Error 296 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.974 [VENDOR SPECIFIC]
ca 00 80 b0 48 12 e1 00 00:11:07.973 WRITE DMA
ca 00 80 30 48 12 e1 00 00:11:07.972 WRITE DMA
ca 00 80 b0 47 12 e1 00 00:11:07.972 WRITE DMA
ca 00 80 30 47 12 e1 00 00:11:07.972 WRITE DMA
Error 295 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.927 [VENDOR SPECIFIC]
ca 00 80 b0 2a 12 e1 00 00:11:07.926 WRITE DMA
ca 00 80 30 2a 12 e1 00 00:11:07.925 WRITE DMA
ca 00 80 b0 29 12 e1 00 00:11:07.925 WRITE DMA
ca 00 80 30 29 12 e1 00 00:11:07.924 WRITE DMA
Error 294 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.899 [VENDOR SPECIFIC]
ca 00 80 b0 22 12 e1 00 00:11:07.898 WRITE DMA
ca 00 80 30 22 12 e1 00 00:11:07.897 WRITE DMA
ca 00 80 b0 21 12 e1 00 00:11:07.897 WRITE DMA
ca 00 80 30 21 12 e1 00 00:11:07.896 WRITE DMA
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 6288 -
# 2 Conveyance offline Completed without error 00% 6285 -
# 3 Short offline Completed without error 00% 6285 -
# 4 Extended offline Completed without error 00% 6283 -
# 5 Extended offline Completed without error 00% 6283 -
# 6 Short offline Completed without error 00% 6283 -
# 7 Extended offline Completed without error 00% 6262 -
# 8 Conveyance offline Completed without error 00% 6262 -
# 9 Conveyance offline Completed without error 00% 6262 -
#10 Extended offline Completed without error 00% 6262 -
#11 Short offline Completed without error 00% 6262 -
#12 Conveyance offline Completed without error 00% 6211 -
#13 Extended offline Completed without error 00% 6211 -
#14 Short offline Completed without error 00% 6211 -
#15 Short offline Completed without error 00% 6075 -
#16 Conveyance offline Completed without error 00% 5564 -
#17 Extended offline Completed without error 00% 5564 -
#18 Short offline Completed without error 00% 5564 -
#19 Conveyance offline Completed without error 00% 5319 -
#20 Short offline Completed without error 00% 5319 -
#21 Conveyance offline Completed without error 00% 4403 -
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
답변1
SSD 교체
댓글로 여러가지 시도를 해보셨는데, 이번 SSD는 뭔가 문제가 있는 것 같습니다.
SMART 판독값으로 판단하면 귀하의 드라이브는 많은 작업을 수행하지 않았으며(일당 최대 250전력, 최대 6TB 기록) 약 2년이 지났다고 합니다. 이는 보증 범위 내에 있어야 합니다!
내 조언은
- 모든 데이터를 즉시 백업하세요(이미 해당 내용을 다뤘다고 말하지만).
- SSD 제거/교체(물론 예산에 따라)
- 교체를 위해 디스크를 제조업체에 보냅니다.
당신의 "슬림 S70" 디스크에는 5년 보증이 적용됩니다.실리콘파워
그냥 보내세요여기에서 RMA 요청을 하세요.
답변2
2017년 5월 11일 이전에 SSD 펌웨어를 업데이트하셨습니다. 그러나 새로운 버전이 출시되었습니다.2017년 9월Windows를 사용하여 적용해야 합니다.
fstrim
파일 시스템에서 사용되지 않는 블록을 삭제하려면 다음을 실행하세요 .
$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed
제 경우에는 Windows 10 파티션에 대한 결과 /mnt/c
가 /mnt/e
이 세상에 없더군요. 그래서 파일을 확인해 보았는데 데이터에는 아무런 해가 없었습니다.
fsck -f
파티션이 마운트되지 않은 경우 Live-USB로 부팅한 후 SSD에서 실행하세요 . 또 다른 옵션은 fsck -f
grub에서 실행 중입니다 .부팅 가능한 USB 스틱을 사용하여 하드 드라이브가 마운트 해제된 동안 하드 드라이브를 fsck하는 방법은 무엇입니까?.
설명에서 언급했듯이 불량 SATA 케이블로 인해 오류가 발생할 수 있습니다. 그러나 ~함에 따라이 답변느슨한 연결로 인해 오류가 발생할 수도 있다는 점을 지적합니다. 불량하거나 느슨한 연결을 배제하려면 SSD에서 플러그를 제거하고 플러그와 드라이브의 수 핀 위로 압축 공기를 불어넣은 다음 케이블을 단단히 다시 연결하세요.
당신의 시간은 얼마나 가치가 있나요?
마지막 질문은 시간의 가치가 얼마나 되는지입니다. 이 문제에 10시간을 소비했다고 가정하면 많은 새로운 120GB SATA III SSD를 다음에서 구입할 수 있기 때문에 시간당 5달러가 됩니다.ebay.com
2018년 2월 23일 업데이트
오늘 밤에 다른 답변을 모두 읽었습니다. 한 가지 대답은 반환하라고 말합니다. 하지만 그렇게 했는데 아무런 문제가 없다고 판단되면 그들은 단순히 그것을 돌려보낼 것이고 당신은 2주에서 2개월 동안 운전을 하지 못할 것입니다.
또 다른 대답은 smartctl이 드라이브에 아무런 문제가 없다고 보고한다고 말합니다.
이 답변에서 나는 실행을 제안했고 fsck -f
귀하는 오류가 보고되지 않았다고 응답했습니다.
fsck
부팅할 때마다 실행
부정적인 대답(반환)과 긍정적인 대답(아무것도 잘못된 것이 없음) 사이의 절충으로서 나의 성향은 다음과 같습니다.fsck
부팅할 때마다 실행. 오류가 발견되면 부팅이 일시 중지되고 오류 메시지를 읽을 수 있습니다. 링크 사용을 요약하려면 다음을 수행하십시오.
sudo tune2fs -c 1 /dev/sdX
참고: X
드라이브 문자(예: , 등)로 a
바꾸 b
십시오..
한 달 동안 오류가 발생하지 않으면 내가 믿는 대부분의 시스템에 일반적인 값 1
으로 변경하십시오. 30
일반적인 SSD에서는 fsck
빠르게 실행됩니다.
SATA 케이블을 청소하고 다시 장착합니다.
다른 사람들은 노트북에 문제가 되는 SATA 케이블 교체를 언급했습니다. 절충안으로 드라이브 측의 모든 케이블을 뽑고 수형 및 암형 끝에 압축 공기를 사용한 다음 케이블을 다시 단단히 연결하는 것을 고려하십시오.
답변3
운전에는 아무런 문제가 없습니다. 모든 테스트가 통과되었습니다. 당신은 단순히 SMART 데이터를 잘못 해석하고 있습니다.
첫째, 첫 번째 스크린샷에는 원시 데이터가 포함되어 있어 이에 대해 어떤 결론도 내릴 수 없습니다. 데이터를 만든 사람이 데이터가 누구에게나 유용할 것이라고 생각하는지는 모르겠지만 실제로는 아무 의미가 없습니다. 창 등에서 오른쪽으로 스크롤하여 의미 있는 열에 도달할 수 없다면 말이죠.
SMART 보고서(귀하가 게시한 후자 보고서)의 열에 대해 설명하겠습니다.
- 속성 이름: 측정항목 이름
- 값: 현재 값이 높을수록 좋습니다. 값은 100 = 최고인 경우 100에서 나오는 경우가 많지만 높을수록 더 좋은 한 어떤 척도도 사용할 수 있습니다. 측정항목이 "오류율"과 같은 것일지라도 정규화되어 있으므로 값이 높을수록 오류율이 낮아집니다.
- 더 나쁨: 관찰된 값이 최악일수록 높을수록 좋습니다.
- Thresh: 값이 이 값 아래로 떨어지면 실패 조건입니다. 이상 = 합격.
- 유형: 이 측정항목에 대한 실패 조건의 의미입니다.
- Old_age: 이 지표는 특정 문제가 아닌 드라이브의 수명/사용량을 나타냅니다.
- 사전 장애: 이 측정항목은 드라이브에 잠재적인 문제가 있음을 나타내며 드라이브 장애 가능성이 높아집니다.
- When_failed: 실패 모드에 진입한 경우
- Raw_value: 값에 기여한 드라이브의 내부 측정 - 이는 최종 사용자에게 유용하지 않으며 값이 낮거나 높다고 해서 반드시 좋거나 나쁨을 나타내는 것은 아닙니다.
보고서의 일부 특정 영역을 다루려면 다음을 수행하십시오.
SMART 종합건강 자가평가 테스트 결과 : PASSED
이는 통과된 모든 것을 반영합니다. 측정된 측정항목 중 오류 상태에 들어간 적이 없습니다.
"오류" 로그는 드라이브에서 비교적 일반적입니다. 이는 반드시 복구할 수 없는 오류나 드라이브 자체의 문제를 나타내는 것은 아닙니다. 그들의 보고서는 모호하므로 컨트롤러에서 DMA 전송 중이었다는 점을 제외하면 실제로 무슨 일이 일어났는지 알 수 없습니다. 그러나 중요한 것이 있으면 전체 상태 보고서에 반영됩니다. 특히 이러한 것들은 컨트롤러 끝에서 취소된 쓰기나 OS가 로드 중에 드라이브가 지원하지 않는 일부 기능을 요청하는 것과 같이 상당히 무해한 것일 수 있습니다. 이는 장치 기능을 조사할 때 완전히 정상일 수 있습니다.
마지막으로 CRC 오류 또는 오류율에 대한 참고 사항: 모든 드라이브에는 오류율이 있습니다. 드라이브는 오류 수정 코드를 사용하여 특정 수의 비트 오류가 예상되고 설계된 고밀도로 데이터를 저장합니다. 오류 수정 코드는 비트 청크당 특정 수의 비트 오류가 발생할 수 있고 100% 수정되도록 보장합니다. 드라이브는 항상 오류 정정 코드를 지속적으로 적용하고 있으며, 오류 정정 코드는 오류가 발생할 가능성이 없도록 설계되었습니다.복구할 수 없음잘 작동하는 드라이브에서는 무작위로 발생하는 오류가 매우 낮습니다(복권에 당첨될 가능성보다 훨씬 낮음). 어떤 통계에서 오류율이 보이더라도 별것 아닌 것처럼 취급된다면 그것은 그렇지 않기 때문에 오류를 수정한 것일 뿐입니다.
답변4
WRITE DMA 오류만 있으므로그리고짧은그리고긴 테스트에서는 오류가 표시되지 않습니다.
그리고 DMA는 직접 메모리 액세스에 관한 것이므로 BIOS에 별도의 하드웨어 진단 테스트가 있는지 확인하고 메모리 관련 테스트를 시도해 보세요.
BIOS 내장 테스트를 사용할 수 없는 경우 오프라인 하드웨어 진단이 가능한 경우 제조업체 지원 사이트를 확인하십시오(예: CD 또는 USB 스틱에 구울 수 있는 부팅 가능한 ISO 파일).
(BTW: 우분투 CD에는 메모리 진단 기능도 있습니다)
DMA 쓰기는 IO이므로 SATA 케이블을 교체하고 그 이후에 새 오류 번호가 추가되지 않았는지 확인하려고 합니다(마지막 오류 번호는 298이지만 지금은 더 추가할 수 있습니다).