
В системе Solaris 11.4 у меня был пул ZFS, занимающий три диска. Пока система была выключена, эти три диска были физически удалены, но ни один из них не zpool export
был zpool destroy
запущен, поэтому в принципе система ожидала, что пул все еще будет существовать. Этот пул нежелателен.
Теперь, каждый раз, когда я вхожу в систему, я сталкиваюсь с сообщением:
NOTE: system has 3 active faults; run 'fmadm list' for details.
Когда я это делаю, я получаю много страниц информации об удаленных дисках с указанием серьезности Major
, идентификаторов сообщений ZFS-8000-CS
и ZFS-8000-PE
, статуса проблемы isolated
, класса проблемы fault.fs.zfs.pool
и fault.fs.zfs.no_replicas
, статуса faulted and taken out of service
и статуса FRU faulty/not present
.
Это само по себе имеет смысл, но один сбивающий с толку аспект заключается в том, что, хотя Fault Manager знает о «проблеме», ZFS — нет. ZFS, похоже, вообще не имеет понятия об отсутствующем пуле. Когда я запускаю, zpool list
я вижу только rpool
(других пулов нет). То же самое с zpool status
и zdb
; оба перечисляют только исправные rpool
, не выдают ошибок, сбоев или ухудшений и вообще не упоминают неисправный пул. Если я попробую zpool status badpool
, я получаю:
cannot open 'badpool': no such pool
Так как мне этот пул не нужен, я попробовал zpool destroy badpool
, но это также приводит к:
cannot open 'badpool': no such pool
-f
не помогает, как и ожидалось выдает то же самое сообщение.
Я не знаю, что привело систему в это состояние, когда ZFS не имеет понятия о пуле, в то время как Fault Manager все еще жалуется на него. Возможно, кто-то уже выполнил команды ZFS по его уничтожению после того, как он был отключен.
Я просмотрел страницу руководства fmadm
«Управление сбоями, дефектами и оповещениями в Oracle® Solaris 11.4», но в интерфейсе, похоже, зияет дыра: предполагается, что вы «отремонтируете», «замените» или «оправдаете» устройства, но нет никаких указаний на то, что именно нужно делать.если вам больше не нужно устройство или предоставляемая им услуга.
Итак, мои вопросы:
Почему Fault Manager может все еще помнить пул, о котором ZFS, похоже, забыла? И,
Как заставить Fault Manager забыть об этом?
Вывод zpool status
, ничем не примечательный, за исключением пропуска отсутствующего пула, таков:
pool: rpool
id: 3268360325047915522
state: ONLINE
scan: scrub repaired 0 in 54s with 0 errors on Tue Sep 19 20:05:51 2023
config:
NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
c2t0d0 ONLINE 0 0 0
errors: No known data errors