アップデート

Question

あなたが試している解決策を使用して fsck を強制する方法はわかりませんが、別の解決策を提案できます:

tune2fs非常に低い再マウントと非常に低いタイムスタンプに値を使用して制限します

# To see current settings
sudo tune2fs -l /dev/sda4
# To alter it
sudo tune2fs -c 1 -i 1d /dev/sda4

これにより、1 回の再マウントごと、または前回のチェックから 1 日ごと (どちらか早い方) にチェックが強制実行されます。

スマートチェック

他の人が言っているように、これはハードウェアの問題に対する応急処置にすぎません。HDD が故障している場合もあれば、無関係なハードウェアの問題 (memtest を実行) の場合もあり、SATA ケーブルが緩んでいるだけの場合もあります (両端からプラグを抜いて再度差し込みます。それでも問題が解決しない場合は、別のケーブルを試してください)。

最悪のシナリオとして、PSU が故障して HW の残りの部分に損傷を与える可能性があるので注意してください (このような場合、新しい HDD は時間が経つにつれて PSU によって損傷するため、HDD を交換しても問題は一時的にしか解決しません)。電圧が許容レベル内であることを確認します。

スマートの出力を投稿します:

sudo smartctl -a /dev/sda

何が起こっているのかを診断するのに役立ちます。

アップデート

tune2fs 経由で fsck を実行できない理由もわかりません。

しかし、私はあなたの SMART を見ました。それによると、ディスクは古くなってはいますが、健全なようです。

問題は SATA ケーブルなど、他の場所にある可能性があります。

fsck を動作させることができない場合、私が提案できるのは、liveUsb から起動してコマンドを手動で実行することだけです。

アップデート2

OK、dmseg メッセージを投稿しました。SMARTとOSから矛盾した情報が届いていますなので詳しく書いてみます。

不良ブロック

SMARTは、ドライブに不良ブロックがあると言っています。これは、古くなったSSDでは普通のことです。ドライブはデータをスペアブロックに再割り当てします。スペアがなくなると、ドライブを交換する必要があります。

SMARTは不良ブロックの量が「正常」範囲内であると報告している: ここで確認する最も重要な属性はReallocated_Sector_CtとですRuntime_Bad_Block。

311 個の不良ブロックが検出され、311 個がスペアに再割り当てされたと表示されます。これは良いことです。不良ブロックが 311 個あったのに再割り当てが 310 個だけだった場合、ブロックの 1 つでデータが失われたことを意味します。

重要なのは「標準化された」値 (038) です。これは、製造元が正常とみなす値を通知する方法です。

100 は完璧、0 は非常に悪いという値です。現在は 38 で、「これは悪くなっています」と表示されています。ただし、メーカーは、この値が 010 (THRESHold) を超えている限りは問題ないと言っています。

ここで初めて矛盾する情報があります。Used_Rsvd_Blk_Cnt_Tot保護区は全く手つかずのままだというのです不良ブロックがあるにもかかわらず、それは一致しません。

しかし、ファームウェアがこの値を報告しているにもかかわらず、それを追跡しないとしても驚かないので、今のところはこれを無視します。

ウェアレベリング

これは、読み取るのに最も問題のある属性です。Wear_Leveling_Count001 と表示されます。通常、値 1 はドライブが故障しており、すぐに交換する必要があることを意味します。

これは予備ブロックが不足していることを意味します。ただし、この属性が逆方向に報告されるファームウェアのバグがあり、値 1 はドライブの健全性が 99% であることを意味します。

を使ってTBW計算機書き込まれたLBAの数と512セクターサイズを入力すると、ドライブには77.43TiBが書き込まれていることがわかりました。Googleによると、あなたのモデルは150TBWであるはずなので、すべきまだ実行可能である。

残念ながら、ここでの最善の解決策は、Windowsボックスを起動して実行することです。クリスタルディスク情報これは、これらのファームウェアのバグを考慮し (内部データベースを使用)、非常に正確なヘルス評価を報告します。

あなたのスマートな発言を考えるとSMART overall-health self-assessment test result: PASSED、1% ではなく 99% と言いたいのではないかと私は思います。

しかし、私が間違っていた場合はここで止めて、ディスクを交換する必要があります。

ケーブルの問題 / マザーボードの問題

Linux の dmesg のエラーは基本的に、セクターを読み取ろうとしたが不正なデータが取得されたことを示しています。

カーネルは、セクター 235602696 を 2 回読み取ろうとしたが、異なるデータが取得されたとさえ言っています。

28 00 0e 0b 03 08 00 002000
28 00 0e 0b 03 08 00 000800.

ディスクにエラーがないと表示されているのに、OS にはエラーがあると表示されている場合は、転送中にデータが破損しています。通常、これは次のことを示します。

SATAケーブルが緩く差し込まれている
SATAケーブルが破損しています
電源ケーブルが緩く差し込まれている
電源ケーブルが破損しています
マザーボードバス障害
PSUの故障
RAM障害

しかし、ここで矛盾する情報の2番目の情報源: UDMA_CRC_Error_Count0です。

これは、ディスクが不良/緩んだケーブルや不良なマザーボードバスによって引き起こされたエラーを 1 つも検出しなかったことを意味します。

これは非常にありそうにありません。SMART はディスクに問題がないと示し、OS からディスクに届くコマンドが配線不良によって破損することはありません。しかし、OS は同じセクターを 2 回読み取り、異なるバイトを取得しました。

これを可能にする唯一の方法は、RAM が不良である場合だと考えられます。または、ディスクに入力されるデータはすべて破損しないが、ディスクから出力されるデータは破損するという、極めてまれなケーブルの問題もあります。

行動方針

直感的にはディスクが不良のようです。しかし:

すべてのデータを別のディスクにバックアップします。LiveUSB 実行時 (および十分な大きさの外付け USB ドライブ) では、次のようになります。

sudo apt install zstd

# To backup
sudo zstd -16v < /dev/sda > /media/external_disk/backup_file.zst

# To restore (don't do that on step 1, see step 5)
sudo zstdcat -v /media/external_disk/backup_file.zst > /dev/sda

データを再度バックアップしますが、今回は通常のコピーファイルのみを使用します (ディスクが故障した場合、ディスクの圧縮された zstd イメージをループマウントしてそこからファイルを読み取るよりも、単純なバックアップから回復する方がはるかに簡単です)
再起動してmemtestを実行し、RAMエラーを削除します
シャットダウンしてケースを開け、SATA ケーブルと電源ケーブル (ドライブ用) を抜き差しします。損傷がないか確認します。場合によっては交換します。
LiveUSB ドライブを再度起動し、ディスクの安全な消去を実行します。ドライブにバグがある場合は、これで動作可能な状態にリセットされる可能性があります (または、ディスクが修復不可能な場合は、最後に実行したコマンドが実行される場合があります)。これには数分かかるはずです。

sudo blkdiscard -s /dev/sda

sudo zstdcatここまでうまくいけば、手順 1 のコマンドを使用してバックアップを復元します。

ディスクにまだ問題があり、memtest が成功した場合、個人的にはディスクが不良であると判断するでしょう。

Reallocated_Sector_Ctメーカーはまだ「それほど」悪くないと言っているにもかかわらず、値が 038 というのは状況が悪化しつつあることを意味しているということを無視することはできません。

ああ! 重要: ディスクの電源を 3 か月以上オフにしたままにしていた場合、このシナリオは十分にあり得ます。一般に信じられていることとは異なり、NAND セルは、電源を長時間オフにしたままにしておくと、ストレージが失われることがあります (「長時間」は 7 日から 7 年までの範囲ですが、最も一般的なケースは 3 か月です)。特に、ディスクが古い場合はそうです。

このような事態が発生した場合は、上記の手順を実行してください: データをバックアップし、ディスクを安全に消去し、バックアップを復元します。

幸運を。

Answer 1

あなたが試している解決策を使用して fsck を強制する方法はわかりませんが、別の解決策を提案できます:

tune2fs非常に低い再マウントと非常に低いタイムスタンプに値を使用して制限します

# To see current settings
sudo tune2fs -l /dev/sda4
# To alter it
sudo tune2fs -c 1 -i 1d /dev/sda4

これにより、1 回の再マウントごと、または前回のチェックから 1 日ごと (どちらか早い方) にチェックが強制実行されます。

スマートチェック

他の人が言っているように、これはハードウェアの問題に対する応急処置にすぎません。HDD が故障している場合もあれば、無関係なハードウェアの問題 (memtest を実行) の場合もあり、SATA ケーブルが緩んでいるだけの場合もあります (両端からプラグを抜いて再度差し込みます。それでも問題が解決しない場合は、別のケーブルを試してください)。

最悪のシナリオとして、PSU が故障して HW の残りの部分に損傷を与える可能性があるので注意してください (このような場合、新しい HDD は時間が経つにつれて PSU によって損傷するため、HDD を交換しても問題は一時的にしか解決しません)。電圧が許容レベル内であることを確認します。

スマートの出力を投稿します:

sudo smartctl -a /dev/sda

何が起こっているのかを診断するのに役立ちます。

アップデート

tune2fs 経由で fsck を実行できない理由もわかりません。

しかし、私はあなたの SMART を見ました。それによると、ディスクは古くなってはいますが、健全なようです。

問題は SATA ケーブルなど、他の場所にある可能性があります。

fsck を動作させることができない場合、私が提案できるのは、liveUsb から起動してコマンドを手動で実行することだけです。

アップデート2

OK、dmseg メッセージを投稿しました。SMARTとOSから矛盾した情報が届いていますなので詳しく書いてみます。

不良ブロック

SMARTは、ドライブに不良ブロックがあると言っています。これは、古くなったSSDでは普通のことです。ドライブはデータをスペアブロックに再割り当てします。スペアがなくなると、ドライブを交換する必要があります。

SMARTは不良ブロックの量が「正常」範囲内であると報告している: ここで確認する最も重要な属性はReallocated_Sector_CtとですRuntime_Bad_Block。

311 個の不良ブロックが検出され、311 個がスペアに再割り当てされたと表示されます。これは良いことです。不良ブロックが 311 個あったのに再割り当てが 310 個だけだった場合、ブロックの 1 つでデータが失われたことを意味します。

重要なのは「標準化された」値 (038) です。これは、製造元が正常とみなす値を通知する方法です。

100 は完璧、0 は非常に悪いという値です。現在は 38 で、「これは悪くなっています」と表示されています。ただし、メーカーは、この値が 010 (THRESHold) を超えている限りは問題ないと言っています。

ここで初めて矛盾する情報があります。Used_Rsvd_Blk_Cnt_Tot保護区は全く手つかずのままだというのです不良ブロックがあるにもかかわらず、それは一致しません。

しかし、ファームウェアがこの値を報告しているにもかかわらず、それを追跡しないとしても驚かないので、今のところはこれを無視します。

ウェアレベリング

これは、読み取るのに最も問題のある属性です。Wear_Leveling_Count001 と表示されます。通常、値 1 はドライブが故障しており、すぐに交換する必要があることを意味します。

これは予備ブロックが不足していることを意味します。ただし、この属性が逆方向に報告されるファームウェアのバグがあり、値 1 はドライブの健全性が 99% であることを意味します。

を使ってTBW計算機書き込まれたLBAの数と512セクターサイズを入力すると、ドライブには77.43TiBが書き込まれていることがわかりました。Googleによると、あなたのモデルは150TBWであるはずなので、すべきまだ実行可能である。

残念ながら、ここでの最善の解決策は、Windowsボックスを起動して実行することです。クリスタルディスク情報これは、これらのファームウェアのバグを考慮し (内部データベースを使用)、非常に正確なヘルス評価を報告します。

あなたのスマートな発言を考えるとSMART overall-health self-assessment test result: PASSED、1% ではなく 99% と言いたいのではないかと私は思います。

しかし、私が間違っていた場合はここで止めて、ディスクを交換する必要があります。

ケーブルの問題 / マザーボードの問題

Linux の dmesg のエラーは基本的に、セクターを読み取ろうとしたが不正なデータが取得されたことを示しています。

カーネルは、セクター 235602696 を 2 回読み取ろうとしたが、異なるデータが取得されたとさえ言っています。

28 00 0e 0b 03 08 00 002000
28 00 0e 0b 03 08 00 000800.

ディスクにエラーがないと表示されているのに、OS にはエラーがあると表示されている場合は、転送中にデータが破損しています。通常、これは次のことを示します。

SATAケーブルが緩く差し込まれている
SATAケーブルが破損しています
電源ケーブルが緩く差し込まれている
電源ケーブルが破損しています
マザーボードバス障害
PSUの故障
RAM障害

しかし、ここで矛盾する情報の2番目の情報源: UDMA_CRC_Error_Count0です。

これは、ディスクが不良/緩んだケーブルや不良なマザーボードバスによって引き起こされたエラーを 1 つも検出しなかったことを意味します。

これは非常にありそうにありません。SMART はディスクに問題がないと示し、OS からディスクに届くコマンドが配線不良によって破損することはありません。しかし、OS は同じセクターを 2 回読み取り、異なるバイトを取得しました。

これを可能にする唯一の方法は、RAM が不良である場合だと考えられます。または、ディスクに入力されるデータはすべて破損しないが、ディスクから出力されるデータは破損するという、極めてまれなケーブルの問題もあります。

行動方針

直感的にはディスクが不良のようです。しかし:

すべてのデータを別のディスクにバックアップします。LiveUSB 実行時 (および十分な大きさの外付け USB ドライブ) では、次のようになります。

sudo apt install zstd

# To backup
sudo zstd -16v < /dev/sda > /media/external_disk/backup_file.zst

# To restore (don't do that on step 1, see step 5)
sudo zstdcat -v /media/external_disk/backup_file.zst > /dev/sda

データを再度バックアップしますが、今回は通常のコピーファイルのみを使用します (ディスクが故障した場合、ディスクの圧縮された zstd イメージをループマウントしてそこからファイルを読み取るよりも、単純なバックアップから回復する方がはるかに簡単です)
再起動してmemtestを実行し、RAMエラーを削除します
シャットダウンしてケースを開け、SATA ケーブルと電源ケーブル (ドライブ用) を抜き差しします。損傷がないか確認します。場合によっては交換します。
LiveUSB ドライブを再度起動し、ディスクの安全な消去を実行します。ドライブにバグがある場合は、これで動作可能な状態にリセットされる可能性があります (または、ディスクが修復不可能な場合は、最後に実行したコマンドが実行される場合があります)。これには数分かかるはずです。

sudo blkdiscard -s /dev/sda

sudo zstdcatここまでうまくいけば、手順 1 のコマンドを使用してバックアップを復元します。

ディスクにまだ問題があり、memtest が成功した場合、個人的にはディスクが不良であると判断するでしょう。

Reallocated_Sector_Ctメーカーはまだ「それほど」悪くないと言っているにもかかわらず、値が 038 というのは状況が悪化しつつあることを意味しているということを無視することはできません。

ああ! 重要: ディスクの電源を 3 か月以上オフにしたままにしていた場合、このシナリオは十分にあり得ます。一般に信じられていることとは異なり、NAND セルは、電源を長時間オフにしたままにしておくと、ストレージが失われることがあります (「長時間」は 7 日から 7 年までの範囲ですが、最も一般的なケースは 3 か月です)。特に、ディスクが古い場合はそうです。

このような事態が発生した場合は、上記の手順を実行してください: データをバックアップし、ディスクを安全に消去し、バックアップを復元します。

幸運を。

アップデート

答え1

スマートチェック

アップデート

アップデート2

不良ブロック

ウェアレベリング

ケーブルの問題 / マザーボードの問題

行動方針

関連情報