Información de fondo primero. El servidor en el que esto ocurre solo ha estado activo por menos de un año e incluye un SAS JBOD externo. Este servidor estaba destinado a asumir las funciones de un antiguo servidor web, que ejecutaba Debian 8, y su servidor de almacenamiento dedicado.
Se completó una instalación estándar de Debian Buster y después de realizar una configuración básica, la mayor parte de la pila LAMP, menos la parte de la base de datos debida a un servidor de base de datos dedicado, se instaló desde los repositorios. Luego se instaló ZFS, también desde los repositorios, se configuró un grupo para usar todas las unidades en el JBOD y se configuró un sistema de archivos ZFS. Hasta ahora, todo bien. Por último, instalé todo el software que también estaba en el antiguo servidor web para evitar que se produjeran problemas con el sitio web.
Luego vino la configuración y, después de todo, reflejando la configuración del sistema operativo en el servidor anterior, copié todos los archivos de configuración personalizados de Apache del servidor anterior al nuevo. Luego, los certificados y claves SSL y SSH se copiaron con actualizaciones planificadas poco después de que se verificara que todo funcionaba. Luego se completó una copia inicial del contenido del sitio web, incluido el contenido del servidor de datos. Por último, se tuvieron que hacer algunos ajustes menores en las configuraciones de Apache, principalmente porque el servidor de datos ahora estaba en un nuevo hogar, lo que se redujo a reemplazar /mnt/xxx con /zfsroot/xxx. Después de que todo estuvo hecho, se realizó un reinicio y el sitio estuvo activo, al menos dentro de la red local.
Todas las personas del sitio web revisaron el sitio y no encontraron problemas con el navegador. Todo parecía funcionar muy bien, pero antes de hacer el cambio surgió un problema. El antiguo servidor de datos estaba dentro de una DMZ secundaria, mientras que todos los servidores web vivían en la DMZ primaria. El acceso a todos los servidores DMZ principales se realiza a través de una única cuenta no raíz en cualquier servidor con claves SSH y contraseñas que se cambian mensualmente. Abrir el servidor web principal para basar el acceso de los usuarios para agregar datos y modificar el sitio sobre la marcha se consideró un riesgo de seguridad demasiado grande, por lo que se tuvo que usar el antiguo servidor de datos por ahora. Este servidor utiliza NFSv3 a través de un enlace dedicado, literalmente solo un cable CAT6 entre dos interfaces, para proporcionar al sitio web los datos necesarios mientras mantiene a los usuarios fuera del servidor principal. Así que preparé la interfaz y los puntos de montaje y cambié las configuraciones de Apache para que apunten a ellos. Por último, hice una sincronización final entre el servidor web antiguo y el nuevo, cambié la IP para usar la IP del servidor anterior (por razones de firewall y NAT), apagué ambos servidores web, moví el cable del servidor de datos y encendí el nuevo. . Entonces empezaron los problemas.
Primero, fue un problema aparente con la cantidad de procesos de Apache que alcanzaban el límite superior. El nuevo servidor era más potente que el anterior, así que calculé un nuevo límite superior y lo configuré. Luego, ese problema volvió a ocurrir y mi primer paso fue reiniciar apache2.service, lo que dio el error que se muestra en el título: "Error al obtener propiedades: el punto final de transporte no está conectado". Intenté reiniciar el servidor, usando systemd reboot y el viejo apagado -r, y ambos fallaron. Así que ideé un procedimiento de apagado decente que termina con algunas claves sysrq y funcionó. Mirando los registros del sistema encontré una gran cantidad de errores de NFS, consulteesta pregunta, pero nada más. Tenga en cuenta que en esa pregunta todo falló después de actualizar de Debian 8 a 11. Eso sucedió después de que se configuró el nuevo servidor como una posible solución y me concentré mucho en él.
¿Podría NFS estar causando esto? ¿Quizás las configuraciones de Apache2? No lo sé y la búsqueda de ese mensaje de error no me da casi nada. Se agradece cualquier ayuda.