NGINX: 트래픽 급증으로 인한 디스크 쓰기 급증 및/또는 작업자 부족 오류로 인해 500 오류 발생

NGINX: 트래픽 급증으로 인한 디스크 쓰기 급증 및/또는 작업자 부족 오류로 인해 500 오류 발생

저는 프로덕션 서버에 발생한 문제를 진단하려고 노력해 왔습니다. 4개의 애플리케이션 서버 간에 요청을 분할하는 로드 밸런서로 NGINX를 실행하는 서버가 있습니다. 사이트를 테스트하는 동안 하루 중 적어도 몇 번은 몇 초 동안만 지속되는 500개의 오류가 발생합니다.

오류 로그와 액세스 로그, 새로운 유물에 대한 그래프, 호스팅 서비스를 살펴보면서 몇 가지 사실을 발견했습니다...

하루에 몇 번씩 로드 밸런서의 디스크 쓰기가 갑자기 엄청나게 증가합니다. 나는 이것이 짧은 시간 내에 액세스 로그에 너무 많은 요청이 기록되었기 때문이라고 확신합니다(어제는 300MB가 넘었는데, 대부분은 매우 짧은 시간 안에 들어왔습니다)... 거의 다음과 같습니다. 여러 요청이 차단되면 쌓였다가 동시에 뱉어냅니다.

또한 가끔 오류 로그에 "768 작업자 연결이 충분하지 않습니다..."라는 메시지가 표시됩니다. 이 한도를 높여야 할 것 같은데, 얼마나 많은지, 또는 작동할 최대값을 어떻게 찾을 수 있는지 잘 모르겠습니다.

이 두 가지 문제가 연결되어 있는지, 아니면 둘 중 하나가 무작위 500 오류를 일으키는지 확실하지 않습니다.

추가 진단에 대한 통찰력이나 조언을 주시면 대단히 감사하겠습니다!

관련 정보