FreeNAS システムで繰り返し発生するハードドライブの問題を診断するにはどうすればよいですか?

FreeNAS システムで繰り返し発生するハードドライブの問題を診断するにはどうすればよいですか?

私は自宅に、RAID-Z2 構成の 2TB Seagate Barracuda ST2000DM006 ドライブ 8 台を搭載した FreeNAS (11.2-U8) サーバーをセットアップしました。

システム ハードウェアの残りの部分は次のとおりです。

  • CPU: Intel(R) Core(TM) i3-4170 CPU @ 3.70GHz
  • 電源: EVGA 100-W1-0500-KR
  • マザーボード: ASRock C226 (ECC対応)
  • ラム: NEMIX RAM 16GB (2 x 8GB) DDR3-1066MHz PC3-8500 (ECC)

このセットアップは問題なく 2.5 年間稼働していましたが、その後、ADA7 ポートに接続されたハード ディスクで SATA エラーが発生し始めました。2.5 年では短いと感じたので、より長い保証期間がある「NAS グレード」のドライブに交換することにし、WD Red Pro WD2002FFSX を購入しました。

プールの再シルバー化に成功した後、わずか数日の操作で、この新しいドライブで同じタイプの SATA エラーが発生し始めました。

ケーブルに問題があるのではないかと疑い始めたので、ADA6 と ADA7 のドライブから SATA ケーブルの一方の端を交換し、問題のあるドライブを ADA6 に接続しました。エラーは引き続きフラグ付けされましたが、今度は ADA6 で発生しました。ケーブル不良やマザーボード ポートの問題の可能性はなくなりました。

それぞれのポートにすべてを再接続した後、ADA6 と ADA7 の電源ケーブルを交換しました。ADA7 ではエラーがまだ存在していたため、電源ケーブルは正常です。

そうは言っても、デバッグの次のステップは何でしょうか? 私はこの件についての専門家ではないので、運が悪く 2 つのドライブが不良だったか、あるいは何か他のことが起こっていてそれが何なのか全く分からないかのどちらかのようです。

表示されるエラーは次のとおりです:

Device: /dev/ada7, ATA error count increased from 2960 to 2961
Device: /dev/ada7, not capable of SMART self-check
Pool main state is DEGRADED: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.

すべてのハード ドライブが SMART 対応であることを述べなければなりません。NAS が数日間問題なく動作しているのに、その後、問題を報告するメールが繰り返し送られてくることがあります。これは本当に散発的な動作です。

答え1

これはソフトウェアの問題だと思います。正確に特定することはできませんが、NAS で可能なすべてのアップデートを実行する (最新のアップデート トレイン 11.3 に切り替え、すべてのプール アップグレードを実行する) と、問題が解決したようです。

すべてを更新してからほぼ 2 か月間、問題なく実行しています。

関連情報