Сначала предыстория. Сервер, на котором это происходит, работает меньше года и включает внешний SAS JBOD. Этот сервер должен был взять на себя обязанности старого веб-сервера, работающего под управлением Debian 8, и его выделенного сервера хранения.
Стандартная установка Debian Buster была завершена, и после базовой настройки большая часть стека LAMP, за исключением части DB из-за выделенного сервера DB, была установлена из репозиториев. Затем была установлена ZFS, также из репозиториев, настроен пул для использования всех дисков в JBOD и настроена файловая система ZFS. Пока все хорошо. Наконец, я установил все программное обеспечение, которое также было на старом веб-сервере, чтобы предотвратить возникновение каких-либо проблем с веб-сайтом.
Затем настала очередь конфигурации, и после всего, кроме зеркалирования конфигурации ОС на старом сервере, я скопировал все настроенные файлы конфигурации Apache со старого сервера на новый. Затем были скопированы сертификаты и ключи SSL и SSH с обновлениями, запланированными вскоре после того, как все будет проверено на работоспособность. Затем была завершена первоначальная копия содержимого веб-сайта, включая содержимое на сервере данных. Наконец, пришлось сделать некоторые незначительные настройки конфигураций Apache, в основном потому, что содержимое сервера данных теперь находилось в новом месте, что сводилось к замене /mnt/xxx на /zfsroot/xxx. После того, как все было сделано, была выполнена перезагрузка, и сайт заработал, по крайней мере, в локальной сети.
Все веб-сайтовцы проверили сайт и не нашли никаких проблем в браузере. Казалось, что все работает отлично, но прежде чем я сделал переключение, возникла проблема. Старый сервер данных находился во вторичной DMZ, в то время как все веб-серверы находились в первичной DMZ. Доступ ко всем первичным серверам DMZ осуществляется через одну учетную запись без прав root на любом сервере с ключами SSH и паролями, которые меняются ежемесячно. Открытие основного веб-сервера для базового доступа пользователей для добавления данных и изменения сайта на лету было сочтено слишком большим риском для безопасности, поэтому пока пришлось использовать старый сервер данных. Этот сервер использует NFSv3 по выделенному каналу, буквально просто кабель CAT6 между двумя интерфейсами, чтобы предоставить веб-сайту необходимые данные, не допуская при этом пользователей к основному серверу. Поэтому я подготовил интерфейс и точки монтирования и изменил конфигурации Apache, чтобы они указывали на них. Наконец, я сделал финальный rsync между старым и новым веб-серверами, изменил IP на IP старого сервера (из соображений брандмауэра и NAT), выключил оба веб-сервера, переместил кабель сервера данных и включил новый. Затем начались проблемы.
Сначала это была очевидная проблема с количеством процессов Apache, достигающих верхнего предела. Новый сервер был мощнее старого, поэтому я вычислил новый верхний предел и установил его. Затем эта проблема возникла снова, и моим первым шагом был перезапуск apache2.service, который выдал ошибку, показанную в заголовке: «Не удалось получить свойства: конечная точка транспорта не подключена». Я попытался перезагрузить сервер, используя как systemd reboot, так и старый добрый shutdown -r, и оба они не увенчались успехом. Поэтому я разработал достойную процедуру выключения, заканчивающуюся некоторыми ключами sysrq, и это сработало. Просмотрев системные журналы, я нашел множество ошибок NFS, см.этот вопрос, но ничего больше. Обратите внимание, что в этом вопросе все упало после обновления с Debian 8 до 11. Это произошло после того, как новый сервер был настроен как возможное исправление, и я сосредоточился на нем.
Может ли NFS быть причиной этого? Может быть, конфигурации Apache2? Я не знаю, и поиск по этому сообщению об ошибке ничего мне не дал. Любая помощь приветствуется.