
コンテクスト
最近、freeNAS が 1 つのドライブに問題があることを知らせていることに気付きました。約 16 個の不良セクタがあり、スマート テストなどを実行しました。同じ容量の新しいドライブを購入し、インストールしようとしたところ、何らかの理由で他のドライブの 1 つの電源アダプタが部分的に緩んでしまったため、RAID Z2 アレイの 6 台のうち 4 台のドライブが使用できなくなり、基本的に冗長性がなくなりました。
アレイは再同期を開始しましたが、完了せず、常にエラーが多すぎる (14k+) と表示されました。特にケースを開けた直後に 2 台目のドライブが故障したことを考えると、実際に 2 台のドライブが故障する可能性は低いため、電源アダプタの部分が原因だとわかりました。再度差し込みましたが、ZFS は何もできませんでした。
結局、古いドライブ (同じドライブですが、ZFS は何らかの理由でそれを認識できず、gpt / smartctl / zpool で一致しました) をそれ自体に置き換え、ZFS は再シルバリングに戻りました。
もちろん、これでも同じエラーがすべて発生し、今度は 3 番目のドライブが理由もなく再シルバー化されます。ZFS のクリアとスクラブを数回実行しましたが、毎日一日中再シルバー化が続いて失敗し、さらにクリアして再シルバー化しても、状況は変わりません。
実際には 1 つのドライブのみが故障し、すぐに交換されたという比較的リスクの低い状況から ZFS が回復できないことに私は深く失望していますが、NAS とそのメインの唯一の共有はまだ使用可能であり、最初のディスク障害の後にバックアップを実行していました。
質問
このプールに問題がないこと、そして 2 つの新しいドライブ (そのうちの 1 つは ZFS が使用できるように消去した古いドライブ) を再同期して、これらのエラーが表示されないようにすることを ZFS に理解させる方法はありますか?
resilver -force -scrub_later -everything_is_obviously_fine -or_i_couldnt_possibly_use_the_share -just_mark_it_all_online -lets_get_back_to_actual_work_now のように?
とりとめのない話
現時点では、raidz2 プール内の 6 台のドライブのうち 3 台を再シルバー化しているように見せかけていますが、明らかにそこに使用可能なデータがあるのに、そんなことをできる人がいるのか疑問に思います。
すぐにドライブを 4 台に増やす予定ですが、もしかしたら 6 台すべてに増やして、ハード ドライブの周囲の空気中に蓄積された残留磁性粉塵からすべてのデータを再構築するかもしれません。
ご提案があればぜひお願いします。ありがとうございます!
答え1
結局、回答は得られず、状況は良くなる前に悪化しました。結局、少なくとも 12 回の再シルバー化、スクラブ、クリア、エラーを含むファイルの削除、再起動を行った後、オンラインに戻りました。
全体的に見て、これは主に、ZFS が大きな警告を出すことを好み、zpool ステータスが正確には明確ではないことを意味していると思います。raidz2 の 6 台のうち 3 台のドライブを復元することは物理的に不可能だったためです。
しかし、ほとんどの場合、データがまだ利用可能であり、共有使用の観点からすべてが正常である限り、ここで行ったように、再起動、スクラブ、クリア、およびチェックサム エラーのあるファイルの処理を続行するだけで、おそらく問題は解決します。