Captura de tela da mensagem de erro de despejo de bloqueio
Cerca de uma semana atrás, começamos a receber essas mensagens de erro LkMgr BEGIN Long Held Lock Dump no console do servidor Domino. Agora vemos que isso está fazendo com que o servidor http trave/trave. Leva apenas alguns minutos desde que reiniciamos o servidor até o http travar. Localizei o NoteID do qual ele está reclamando e é sempre um elemento de design de visualização. Tentei excluir esta visualização e criar uma nova do zero, mas no dia seguinte recebo a mesma mensagem de erro LkMgr BEGIN Long Held Lock Dump reclamando do novo elemento de design da visualização.
Alguém sabe o que pode estar causando esses bloqueios? O que pode ser feito para eliminá-los?
Qualquer informação sobre isso seria muito apreciada! Obrigado !
Atenciosamente, Petter Kjeilen
Responder1
Bloqueios mantidos por muito tempo geralmente indicam um problema de acesso ao disco e não um problema com o documento em si. Na sua captura de tela, não diz se há uma atualização do índice de visualização sendo realizada, mas geralmente é isso que vejo causando isso. Essa visualização contém um grande número de documentos? Observe o design da visualização e veja se há uma maneira de reduzir o número de documentos nela, se for esse o caso.
Observe as estatísticas do sistema operacional (no sistema operacional ou por meio do administrador do Domino) e veja se o comprimento da fila de disco é >1. Isso indicaria que há um problema de E/S e você desejará ver se há uma maneira de resolver isso (espalhe por mais disco, mude para SSD, etc.).
Você pode tentar executar uma atualização dessa visualização com o HTTP inativo e ver quanto tempo leva para ser concluído -
load updall db.nsf -T viewname
Monitore as estatísticas da fila de disco enquanto isso está acontecendo e se demorar muito para ser concluído.
Além disso, você pode abrir essa visualização usando um cliente Notes? Existe algo no design que força uma atualização da visualização a cada vez, talvez um @Now ou @Today em uma coluna. Isso seria "ruim" e existem métodos melhores para calcular que isso não causa um impacto no desempenho como esse.