
약 200,000명의 사용자가 있는 애플리케이션이 있고 AWS EC2 로드 밸런서 뒤에서 NGINX + Gunicorn(Python) 서버를 실행하고 있습니다.
내 요청이 항상 4k/분인지 이해가 안 되지만 때로는 트래픽의 절반이 시간 초과 문제로 발생하는 경우도 있습니다. 대부분의 경우 모든 요청은 괜찮지만 가끔 작동이 멈추기 시작하면 거의 모든 요청에 시간 초과가 발생합니다.
현재 연결 수 패턴에 파동이 있고 1000에서 0으로 변동하는 것을 확인했습니다. NGINX 번들링 요청이 어떻게 되었나요? NGINX가 제대로 구성되지 않았는지, 아니면 내 Python 서버가 너무 자주 호출되는 추가 느린 엔드포인트를 받고 있는지 확인하기 위해 request_time을 어떻게 구별할 수 있습니까?
내 NGINX Amplify 대시보드에 서버 중 하나의 스크린샷을 첨부했습니다.
이것이 NGINX 구성 문제인지 또는 호스팅된 Python 프로세스가 잠기는지 확인하기 위해 조사할 수 있는 NGINX 로그 또는 Amplify의 일부에 대한 아이디어가 있습니까? 감사합니다!
답변1
CloudWatch 지표, 특히 "삭제" 또는 "실패"에 대한 지표를 살펴보십시오. 여기에서 로드 밸런서 및 EC2 인스턴스에 대한 모든 세부 정보를 볼 수 있습니다. 사용 중인 인스턴스 유형이 무엇인지는 모르지만 T2/T3 인스턴스를 지속적으로 과도하게 사용하여 크레딧이 부족할 수 있습니다. 어떤 이유로 흐름의 일부가 제한되고 있으며 인스턴스 자체에는 반드시 문제가 되지 않는다고 생각합니다.