먼저 배경 정보. 이 문제가 발생한 서버는 가동된 지 1년이 채 되지 않았으며 외부 SAS JBOD를 포함하고 있습니다. 이 서버는 Debian 8을 실행하는 기존 웹 서버와 전용 스토리지 서버의 역할을 수행하도록 만들어졌습니다.
표준 Debian Buster 설치가 완료되었고 기본 설정이 완료되면 전용 DB 서버로 인한 DB 부분을 제외한 대부분의 LAMP 스택이 리포지토리에서 설치되었습니다. 그런 다음 리포지토리에서 ZFS가 설치되고 JBOD의 모든 드라이브를 사용하도록 설정된 풀과 ZFS 파일 시스템이 설정되었습니다. 여태까지는 그런대로 잘됐다. 마지막으로 웹사이트 관련 문제가 발생하지 않도록 기존 웹 서버에도 있던 모든 소프트웨어를 설치했습니다.
다음은 구성이었고 이전 서버의 OS 구성을 미러링하는 것 외에는 모든 사용자 정의 Apache 구성 파일을 이전 서버에서 새 서버로 복사했습니다. 그런 다음 모든 것이 작동하는 것으로 확인된 직후 계획된 새로 고침을 통해 SSL 및 SSH 인증서와 키가 복사되었습니다. 그런 다음 데이터 서버의 내용을 포함하여 웹사이트 콘텐츠의 초기 복사본이 완성되었습니다. 마지막으로 Apache 구성을 약간 조정해야 했는데, 그 이유는 데이터 서버 관련 항목이 이제 새 홈에 있어서 /mnt/xxx를 /zfsroot/xxx로 대체했기 때문입니다. 모든 작업이 완료된 후 재부팅이 수행되었으며 적어도 로컬 네트워크 내에서는 사이트가 활성화되었습니다.
모든 웹사이트 사람들이 사이트를 검토한 결과 브라우저 내에서 아무런 문제도 발견되지 않았습니다. 모든 것이 잘 작동하는 것 같았지만 전환하기 전에 문제가 발생했습니다. 이전 데이터 서버는 보조 DMZ 내에 있었고 웹 서버는 모두 기본 DMZ에 있었습니다. 모든 기본 DMZ 서버에 대한 액세스는 SSH 키와 비밀번호가 매월 변경되는 한 서버의 루트가 아닌 단일 계정을 통해 이루어집니다. 데이터를 추가하고 사이트를 즉시 수정하기 위해 기본 사용자 액세스를 위해 기본 웹 서버를 여는 것은 보안 위험이 너무 큰 것으로 간주되어 지금은 기존 데이터 서버를 사용해야 했습니다. 이 서버는 전용 링크(말 그대로 두 인터페이스 사이의 CAT6 케이블)를 통해 NFSv3를 사용하여 사용자가 메인 서버에 접근하지 못하게 하면서 필요한 데이터를 웹사이트에 제공합니다. 그래서 인터페이스와 마운트 지점을 준비하고 이를 다시 가리키도록 Apache 구성을 변경했습니다. 마지막으로 이전 웹 서버와 새 서버 간의 최종 재동기화를 수행하고 이전 서버 IP를 사용하도록 IP를 변경하고(방화벽 및 NAT 이유로) 두 웹 서버의 전원을 끄고 데이터 서버 케이블을 이동한 다음 새 서버의 전원을 켰습니다. . 그런 다음 문제가 시작되었습니다.
첫째, 아파치 프로세스 수가 상한에 도달하는 명백한 문제였습니다. 새 서버는 이전 서버보다 강력했기 때문에 새로운 상한선을 계산하여 설정했습니다. 그런 다음 문제가 다시 발생했고 첫 번째 단계는 apache2.service를 다시 시작하는 것이었습니다. 이로 인해 "속성을 가져오지 못했습니다: 전송 끝점이 연결되지 않았습니다."라는 제목에 표시된 오류가 발생했습니다. systemd 재부팅과 기존의 shutdown -r을 모두 사용하여 서버를 재부팅하려고 시도했지만 둘 다 실패했습니다. 그래서 나는 일부 sysrq 키로 끝나는 적절한 종료 절차를 고안했고 그것이 효과가 있었습니다. 시스템 로그를 살펴보면서 수많은 NFS 오류를 발견했습니다.이 질문, 그러나 다른 것은 없습니다. 그 질문에서 데비안 8에서 11로 업그레이드한 후 모든 것이 다운되었다는 점에 주목하십시오. 그것은 새 서버가 가능한 수정 사항으로 설정되고 그것에 집중한 후에 일어났습니다.
NFS가 이 문제를 일으킬 수 있습니까? 어쩌면 Apache2 구성일까요? 나는 모르고 해당 오류 메시지를 검색해도 아무 것도 제공되지 않습니다. 도움을 주시면 감사하겠습니다.