Informações básicas primeiro. O servidor em que isso ocorre está ativo há menos de um ano e inclui um JBOD SAS externo. Este servidor foi projetado para assumir a função de um servidor web antigo, rodando Debian 8, e seu servidor de armazenamento dedicado.
Uma instalação padrão do Debian Buster foi concluída e após uma configuração básica ter sido feita, a maior parte da pilha LAMP, menos a parte do banco de dados devido a um servidor de banco de dados dedicado, foi instalada a partir dos repositórios. Em seguida, foi instalado o ZFS, também a partir dos repositórios, um pool configurado para usar todos os drives do JBOD e um sistema de arquivos ZFS configurado. Até agora tudo bem. Por último, instalei todo o software que também estava no antigo servidor web para evitar a ocorrência de problemas com o site.
Em seguida veio a configuração e depois de espelhar a configuração do sistema operacional no servidor antigo, copiei todos os arquivos de configuração personalizados do Apache do servidor antigo para o novo. Em seguida, os certificados e chaves SSL e SSH foram copiados com atualizações planejadas logo após tudo ter sido verificado como funcionando. Em seguida, foi concluída uma cópia inicial do conteúdo do site, incluindo o material do servidor de dados. Por último, alguns pequenos ajustes nas configurações do Apache tiveram que ser feitos, principalmente porque o servidor de dados estava agora em uma nova casa, o que se resumia à substituição de /mnt/xxx por /zfsroot/xxx. Depois de tudo feito foi realizado um reboot e o site ficou no ar, pelo menos dentro da rede local.
Todas as pessoas do site verificaram o site e não encontraram problemas no navegador. Tudo parecia funcionar muito bem, mas antes de fazer a mudança, um problema foi levantado. O antigo servidor de dados estava dentro de uma DMZ secundária, enquanto todos os servidores web residiam na DMZ primária. O acesso a todos os servidores DMZ primários é feito por meio de uma única conta não root em qualquer servidor com chaves SSH e senhas alteradas mensalmente. Abrir o servidor web principal para basear o acesso do usuário para adicionar dados e modificar o site em tempo real foi considerado um risco de segurança muito grande, então o antigo servidor de dados teve que ser usado por enquanto. Este servidor usa NFSv3 através de um link dedicado, literalmente apenas um cabo CAT6 entre duas interfaces, para fornecer ao site os dados necessários enquanto mantém os usuários fora do servidor principal. Então preparei a interface e os pontos de montagem e alterei as configurações do Apache para apontar de volta para eles. Por último, fiz um rsync final entre o servidor web antigo e o novo, mudei o IP para usar o IP dos servidores antigos (por motivos de firewall e NAT), desliguei ambos os servidores web, movi o cabo do servidor de dados e liguei o novo . Então os problemas começaram.
Primeiro, era um problema aparente com o número de processos do Apache atingindo o limite superior. O novo servidor era mais poderoso que o antigo, então calculei um novo limite superior e o defini. Então esse problema aconteceu novamente e meu primeiro passo foi reiniciar o apache2.service que deu o erro mostrado no título, "Falha ao obter propriedades: o endpoint de transporte não está conectado". Tentei reiniciar o servidor, usando o systemd reboot e o bom e velho shutdown -r, e ambos falharam. Então, desenvolvi um procedimento de desligamento decente, terminando com algumas chaves sysrq e funcionou. Examinando os logs do sistema, encontrei uma infinidade de erros de NFS, consulteessa questão, mas nada mais. Observe que nessa pergunta tudo caiu após a atualização do Debian 8 para 11. Isso aconteceu depois que o novo servidor foi configurado como uma possível correção e eu me concentrei muito nele.
O NFS poderia estar causando isso? Talvez as configurações do Apache2? Não sei e a pesquisa dessa mensagem de erro não me dá quase nada. Qualquer ajuda é apreciada.