SSDを交換する

SSDを交換する

私のノートパソコンのSSD動作が不安定になり、エラーの数が急増しました。前回投稿した時

このドライブは死んでいますか?
今は電源が入っていて、この文章をこのドライブで書いています。データはすべてバックアップしてありますが、まだ使えるかどうかわかりません。

製造元に問い合わせてもあまり役に立ちませんでした。Windows をインストールしてそこからディスク チェック ユーティリティを実行するか、Windows ホストに外付けドライブとして接続してそこでテストするように言われました。
両方試しましたが、エラーは発生しませんでした。

提供されているユーティリティでも確認しました (下のスクリーンショットを参照)。その後、clonezilla で作成したイメージを使用して Ubuntu に戻ると、SATA PHY エラー数が 300 に近づいていることがわかりました。

コネクタも確認しましたが、SSD はラップトップ内にあるため、ケーブルを (簡単に) 変更することはできません。

これらはメーカーのユーティリティによって生成されたテスト結果です

試験結果

smartctlUbuntu での出力は次のようになります。

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.14.0-041400-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     SPCC Solid State Disk
Serial Number:    XXXXXXXXXX
Firmware Version: S9FM02.8
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 (minor revision not indicated)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Feb 18 02:22:56 2018 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (   30) seconds.
Offline data collection
capabilities:            (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (   2) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000a   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       6352
 12 Power_Cycle_Count       0x0012   100   100   000    Old_age   Always       -       2717
168 Unknown_Attribute       0x0012   100   100   000    Old_age   Always       -       0
170 Unknown_Attribute       0x0013   100   100   010    Pre-fail  Always       -       25
173 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       105447539
192 Power-Off_Retract_Count 0x0012   100   100   000    Old_age   Always       -       77
194 Temperature_Celsius     0x0023   070   070   000    Pre-fail  Always       -       30
196 Reallocated_Event_Count 0x0000   100   100   000    Old_age   Offline      -       0
218 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       15431
241 Total_LBAs_Written      0x0012   100   100   000    Old_age   Always       -       6281157

SMART Error Log Version: 1
ATA Error Count: 298 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 298 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:08.077  [VENDOR SPECIFIC]
  ca 00 80 b0 8f 12 e1 00      00:11:08.076  WRITE DMA
  ca 00 80 30 8f 12 e1 00      00:11:08.076  WRITE DMA
  ca 00 80 b0 8e 12 e1 00      00:11:08.075  WRITE DMA
  ca 00 80 30 8e 12 e1 00      00:11:08.074  WRITE DMA

Error 297 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:08.039  [VENDOR SPECIFIC]
  ca 00 80 b0 7c 12 e1 00      00:11:08.038  WRITE DMA
  ca 00 80 30 7c 12 e1 00      00:11:08.038  WRITE DMA
  ca 00 80 b0 7b 12 e1 00      00:11:08.037  WRITE DMA
  ca 00 80 30 7b 12 e1 00      00:11:08.037  WRITE DMA

Error 296 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.974  [VENDOR SPECIFIC]
  ca 00 80 b0 48 12 e1 00      00:11:07.973  WRITE DMA
  ca 00 80 30 48 12 e1 00      00:11:07.972  WRITE DMA
  ca 00 80 b0 47 12 e1 00      00:11:07.972  WRITE DMA
  ca 00 80 30 47 12 e1 00      00:11:07.972  WRITE DMA

Error 295 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.927  [VENDOR SPECIFIC]
  ca 00 80 b0 2a 12 e1 00      00:11:07.926  WRITE DMA
  ca 00 80 30 2a 12 e1 00      00:11:07.925  WRITE DMA
  ca 00 80 b0 29 12 e1 00      00:11:07.925  WRITE DMA
  ca 00 80 30 29 12 e1 00      00:11:07.924  WRITE DMA

Error 294 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.899  [VENDOR SPECIFIC]
  ca 00 80 b0 22 12 e1 00      00:11:07.898  WRITE DMA
  ca 00 80 30 22 12 e1 00      00:11:07.897  WRITE DMA
  ca 00 80 b0 21 12 e1 00      00:11:07.897  WRITE DMA
  ca 00 80 30 21 12 e1 00      00:11:07.896  WRITE DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      6288         -
# 2  Conveyance offline  Completed without error       00%      6285         -
# 3  Short offline       Completed without error       00%      6285         -
# 4  Extended offline    Completed without error       00%      6283         -
# 5  Extended offline    Completed without error       00%      6283         -
# 6  Short offline       Completed without error       00%      6283         -
# 7  Extended offline    Completed without error       00%      6262         -
# 8  Conveyance offline  Completed without error       00%      6262         -
# 9  Conveyance offline  Completed without error       00%      6262         -
#10  Extended offline    Completed without error       00%      6262         -
#11  Short offline       Completed without error       00%      6262         -
#12  Conveyance offline  Completed without error       00%      6211         -
#13  Extended offline    Completed without error       00%      6211         -
#14  Short offline       Completed without error       00%      6211         -
#15  Short offline       Completed without error       00%      6075         -
#16  Conveyance offline  Completed without error       00%      5564         -
#17  Extended offline    Completed without error       00%      5564         -
#18  Short offline       Completed without error       00%      5564         -
#19  Conveyance offline  Completed without error       00%      5319         -
#20  Short offline       Completed without error       00%      5319         -
#21  Conveyance offline  Completed without error       00%      4403         -

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

答え1

SSDを交換する

コメントではいろいろなことを試していますが、この SSD にはいくつか問題があるようです。

SMART の読み取り値から判断すると、ドライブはあまり使用されていない (電源オン日数 ~ 250 日、書き込み量 ~ 6 TB) とのことで、約 2 年前の製品とのことです。これは保証期間内であるはずです。

私のアドバイスは

  • すべてのデータをすぐにバックアップしてください(すでにバックアップ済みだとおっしゃっていますが)
  • SSD を削除/交換する (もちろん予算に応じて)
  • ディスクを製造元に送って交換してもらう

あなたの "スリムS70「ディスクは5年間の保証の対象となりますシリコンパワー 保証

送るだけRMAリクエストはこちら。

答え2

2017年5月11日より前にSSDファームウェアを更新しました。しかし、2017年5月11日に新しいバージョンがリリースされました。2017年9月Windows を使用して適用する必要があります。


fstrimファイルシステム内の未使用のブロックを破棄するには、次を実行します。

$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed

私の場合、Windows 10 パーティションの結果は驚くべきものでした。そこでファイルを確認しましたが、データには何の害もありませんでした/mnt/c/mnt/e


fsck -fパーティションがマウントされていないときにLive-USBで起動した後、SSDで実行します。別のオプションはfsck -fgrubから実行することです -起動可能な USB スティックを使用して、ハード ドライブがマウントされていない状態でハード ドライブを fsck する方法を教えてください。


コメントで述べたように、不良SATAケーブルはエラーを引き起こす可能性があります。しかし、この答えが指摘しているように、緩い接続もエラーの原因になります。接続不良/緩い接続を排除するには、SSD からプラグを取り外し、プラグとドライブのオス ピンに圧縮空気を吹き付けて、ケーブルをしっかりと差し込みます。


あなたの時間はどれくらいの価値があるでしょうか?

最後の質問は、あなたの時間の価値はいくらかということです。この問題に10時間を費やしたと仮定すると、1時間あたり5ドルになります。なぜなら、新品の120GB SATA III SSDは、イーベイ


2018年2月23日更新

今夜、他の回答をすべて読みました。ある回答では、返品するようにと書かれています。しかし、返品しても問題が見つからなければ、単に送り返され、2 週間から 2 か月間ドライブが使用できなくなります。

別の回答では、smartctl はドライブに問題はないと報告しているとのことです。

この回答では実行を提案しましたfsck -fが、エラーは報告されていないと回答されました。

fsck起動ごとに実行する

否定的な答え(返品する)と肯定的な答え(何も問題ない)の間の妥協案として、私はfsck起動時に毎回実行エラーが発見された場合は起動が一時停止され、エラー メッセージを読むことができます。リンクを要約するには、次を使用します。

sudo tune2fs -c 1 /dev/sdX

注: をX実際のドライブ文字 ( abなど)に置き換えます。

1 か月経ってもエラーがない場合は、値を から に変更します130これはほとんどのシステムで標準的だと思います。一般的な SSD では、 はfsck高速に実行されます。

SATAケーブルを清掃して再接続する

他の人は、SATA ケーブルの交換について言及していますが、これはラップトップでは問題です。妥協案としては、ドライブ側のすべてのケーブルを取り外し、オスとメスの端に圧縮空気を吹き付けてから、ケーブルをしっかりと差し込むことを検討してください。

答え3

ドライブに問題はありません。すべてのテストに合格しました。SMART データを誤って解釈しているだけです。

まず、最初のスクリーンショットには生データが含まれており、これについて結論を導き出すことはできません。作成者がそのデータを誰にとってどのような用途に使うと考えているのかはわかりませんが、実際には何の意味もありません。ウィンドウ内を右にスクロールするか何かで意味のある列にアクセスできる場合を除きます。

SMART レポート (あなたが投稿した後者のレポート) の列について説明します。

  • 属性名: メトリックの名前
  • 値: 現在の値。高いほど良い。値は 100 点満点で、100 が最高ですが、高いほど良い限り任意のスケールを使用できます。メトリックが「エラー率」のような場合でも、値が高いほどエラー率が低くなるように正規化されます。
  • 悪い: 観測値が最悪、高いほど良い。
  • しきい値: 値がこれより低くなると不合格になります。これより高くなると合格になります。
  • タイプ: このメトリックに対する失敗条件の意味。
    • Old_age: このメトリックは、特定の問題ではなく、ドライブの古さ/使用状況を示します。
    • 事前障害: このメトリックは、ドライブに潜在的な問題があることを示しており、ドライブ障害の可能性が高まっています。
  • When_failed: 障害モードに入ったとき(もしあった場合)
  • Raw_value: 値に寄与したドライブの内部測定値 - これはエンド ユーザーには役立ちません。また、値が低いか高いかが必ずしも良いか悪いかを示すわけではありません。

レポートの特定の領域について説明します。

SMART総合健康自己評価テスト結果: 合格

これは合格したすべてを反映しています。測定されたメトリックのいずれも失敗状態になったことはありません。

「エラー」のログは、ドライブでは比較的一般的です。これらは、必ずしも回復不可能なエラーやドライブ自体の問題を示すものではありません。レポートはあいまいなので、コントローラでの DMA 転送中であったことを除いて、実際に何が起こったのかはわかりませんが、重要なことがあれば、全体的なヘルス レポートに反映されます。特に、これらは、コントローラ側でキャンセルされた書き込みや、ドライブがサポートしていないロード中の OS の機能を要求したなど、かなり無害なものである可能性があり、デバイスの機能を調査する際にはまったく正常な場合があります。

最後に、CRCエラーまたはエラー率について注意点があります。すべてのドライブにはエラー率があります。ドライブは高密度でデータを保存するため、一定数のビットエラーが予想され、エラー訂正コードを使用して設計されています。エラー訂正コードは、ビットチャンクごとに一定数のビットエラーが発生しても100%訂正されることを保証します。ドライブは常にエラー訂正コードを適用しており、エラー訂正コードは、回復不能正常に機能しているドライブでは、エラーがランダムに発生する可能性は非常に低いです (つまり、宝くじに当たる確率よりも大幅に低い)。統計情報にエラー率が表示され、大したことではないとみなされる場合は、エラーが修正されただけなので、大した問題ではありません。

答え4

書き込みDMAエラーのみがあるためそして短いそして長時間のテストではエラーは発生しません。

DMA はダイレクト メモリ アクセスに関するものなので、BIOS に個別のハードウェア診断テストがあるかどうかを確認し、メモリ関連のテストを試してください。

BIOS 組み込みテストが利用できない場合は、製造元のサポート サイトでオフライン ハードウェア診断が利用できるかどうかを確認します (例: CD または USB スティックに書き込むための起動可能な ISO ファイル)。

(ちなみに、Ubuntu CD にはメモリ診断機能もあります)

DMA 書き込みは IO なので、SATA ケーブルを交換して、その後新しいエラー番号が追加されていないかどうかを確認します (最後のエラー番号は 298 ですが、今後さらに追加される可能性があります)。

関連情報