
Solaris 11.4 システムでは、3 つのドライブを占有する ZFS プールがありました。システムの電源がオフになっている間に、これらの 3 つのドライブは物理的に取り外されましたが、どちらもzpool export
実行zpool destroy
されていなかったため、原則としてシステムはプールがまだ存在していると想定していました。このプールは不要です。
今では、ログインするたびに次のメッセージが表示されます。
NOTE: system has 3 active faults; run 'fmadm list' for details.
これを実行すると、取り外されたディスクに関する多数の情報ページが表示されます。情報には、重大度Major
、メッセージ ID が およびZFS-8000-CS
、ZFS-8000-PE
問題ステータスisolated
、問題クラス およびfault.fs.zfs.pool
、fault.fs.zfs.no_replicas
ステータスfaulted and taken out of service
、FRU ステータス が含まれますfaulty/not present
。
これ自体は意味を成しますが、1 つの紛らわしい点は、Fault Manager は「問題」を認識しているのに対し、ZFS は認識していないことです。ZFS は、不足しているプールの概念をまったく持っていないようです。 を実行すると、zpool list
だけが表示されますrpool
(他のプールはありません)。zpool status
とも同様ですzdb
。どちらも正常な のみをリストしrpool
、エラー、障害、または劣化は表示せず、障害のあるプールについてはまったく言及しません。 を試みるとzpool status badpool
、次のようになります。
cannot open 'badpool': no such pool
このプールは必要ないので、試してみましたzpool destroy badpool
が、次の結果も出ます:
cannot open 'badpool': no such pool
-f
役に立たず、予想どおり同じメッセージが発行されます。
ZFS がプールの概念を持たないのに、Fault Manager がまだそのことについて文句を言っているというこの状態にシステムが陥った原因はわかりません。切断された後に、誰かがすでに ZFS コマンドを実行してプールを破壊した可能性があります。
私は「Oracle® Solaris 11.4 での障害、欠陥、およびアラートの管理」のマニュアルページをざっと読みましたfmadm
が、インターフェースには大きな欠陥があるようです。デバイスを「修復」、「交換」、または「無罪」にすることを要求していますが、何をすべきかについてはまったく言及されていません。デバイスやそれが提供するサービスが不要になった場合。
私の質問は次のとおりです:
なぜ、Fault Manager は ZFS が忘れてしまったと思われるプールをまだ記憶しているのでしょうか? そして、
Fault Manager にこれを忘れさせるにはどうすればよいですか?
の出力はzpool status
、不足しているプールが省略されている点を除けば特に目立った特徴はなく、次のようになります。
pool: rpool
id: 3268360325047915522
state: ONLINE
scan: scrub repaired 0 in 54s with 0 errors on Tue Sep 19 20:05:51 2023
config:
NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
c2t0d0 ONLINE 0 0 0
errors: No known data errors