
Em um sistema Solaris 11.4, eu tinha um pool ZFS ocupando três unidades. Enquanto o sistema estava desligado, essas três unidades foram removidas fisicamente, mas nenhuma zpool export
delas zpool destroy
foi executada, portanto, em princípio, o sistema esperava que o pool ainda existisse. Este pool é indesejado.
Agora, cada vez que faço login, sou confrontado com uma mensagem:
NOTE: system has 3 active faults; run 'fmadm list' for details.
Quando faço isso, recebo muitas páginas de informações sobre os discos removidos, com gravidade Major
, IDs de mensagens de ZFS-8000-CS
e ZFS-8000-PE
, Status do problema de isolated
, Classe de problema de fault.fs.zfs.pool
e fault.fs.zfs.no_replicas
, Status faulted and taken out of service
e Status da FRU de faulty/not present
.
Isso por si só faz sentido, mas um aspecto confuso é que, embora o Fault Manager esteja ciente do "problema", o ZFS não está. O ZFS parece não ter nenhum conceito do pool ausente. Quando corro, zpool list
vejo apenas rpool
(não há outros pools). O mesmo com zpool status
e zdb
; ambos listam apenas os íntegros rpool
, não apresentam erros, falhas ou degradação e não fazem nenhuma menção ao pool com falha. Se eu tentar zpool status badpool
, recebo:
cannot open 'badpool': no such pool
Sendo que não quero esse pool, tentei zpool destroy badpool
, mas também fica:
cannot open 'badpool': no such pool
-f
não ajuda, previsivelmente emite a mesma mensagem.
Não sei o que levou o sistema a esse estado em que o ZFS não tem noção de pool enquanto o Fault Manager ainda está reclamando disso. É possível que alguém já tenha executado comandos do ZFS para destruí-lo após ele ter sido desconectado.
Examinei a página de manual fmadm
"Gerenciando falhas, defeitos e alertas no Oracle® Solaris 11.4", mas a interface parece ter uma lacuna: ela espera que você "repare", "substitua" ou "absolva" dispositivos , mas não há nenhuma menção sobre o que fazerse você não quiser mais o dispositivo ou o serviço que ele oferece.
Então minhas perguntas são:
Por que o Fault Manager ainda se lembra de um pool que o ZFS parece ter esquecido? E,
Como posso fazer com que o Fault Manager esqueça isso?
A saída de zpool status
, normal, exceto pela omissão do pool ausente, é:
pool: rpool
id: 3268360325047915522
state: ONLINE
scan: scrub repaired 0 in 54s with 0 errors on Tue Sep 19 20:05:51 2023
config:
NAME STATE READ WRITE CKSUM
rpool ONLINE 0 0 0
c2t0d0 ONLINE 0 0 0
errors: No known data errors