실행 중인 이미지 크기 조정 서비스의 캐시로 사용되는 500GB Cold HDD EBS 볼륨이 있는 EC2 m4.xlarge 인스턴스를 실행하고 있습니다(nginx 리버스 프록시 뒤에 있는 썸버).
가끔씩 이미지 서비스가 과부하되는 것 같고 병목 현상이 어디에 있는지 알 수 없습니다. CPU 로드와 메모리는 양호해 보이지만 당시에는 트래픽이 크게 증가하지 않은 것 같습니다. 문제와 관련이 있는 것으로 보이는 한 가지는 거의 매일 특정 시간에 VolumeReadBytes가 감소하고 VolumeReadOps가 30분 정도 증가한다는 것입니다. 실행 중인 크론 작업이 없으며 서버는 크기가 조정된 이미지만 제공하는 데 사용됩니다. 이게 무슨 일인지는 모르겠습니다. 이것이 문제가 될 수 있습니까?
어떤 조언이라도 대단히 감사하겠습니다.
답변1
EBS에는 IOPS 및 처리량에 대한 할당량이 있습니다. 무엇인가 IOPS를 최대화하고 있습니다. 질문은 무엇입니까?
이를 알아낼 수 있는 몇 가지 도구가 있습니다. iotop --time --batch
하나입니다. Brendan Gregg의 perf-tools 스크립트의 iosnoop은 또 다른 것입니다., ftrace 구현을 원하는 경우.
모든 읽기 시스템 호출을 기록하도록 auditd를 설정할 수도 있습니다. 하지만 파일 오버로드에 대한 로깅은 아마도 IOPS 할당량의 대부분을 사용하게 될 것입니다.
그러나 결정에 따라 해당 작업을 중지하거나, 더 빠른 저장소를 사용하거나, 이 30분 동안 성능 저하를 허용하도록 요청해야 합니다.