ESXi 호스트(직접 연결 스토리지)에서 높은 대기 시간/낮은 처리량을 해석하는 데 도움을 줄 수 있는 사람이 있습니까?

ESXi 호스트(직접 연결 스토리지)에서 높은 대기 시간/낮은 처리량을 해석하는 데 도움을 줄 수 있는 사람이 있습니까?

면책 조항 - 저는 스토리지 전문가가 아니므로 ELI5 ;) 직접 연결된 스토리지(RAID1의 SAS SSD 및 HDD, 다른 데이터 저장소)가 있는 ESXi를 보고 있습니다. 그래픽에 표시된 시스템 X는 HDD RAID에 있고 다른 하나(시스템 Z)는 SSD에 있습니다.

ESXi - System X의 지연 시간 그래프 ESXi - System X의 지연 시간 그래프

ESXi - 시스템 Z의 지연 시간 그래프 ESXi - 시스템 Z의 지연 시간 그래프

두 시스템 모두 데이터베이스를 사용합니다(다른 것들과 함께). 시스템 X(그래프에 표시됨)는 시스템 Z(Postgres)에서 데이터를 쿼리하고 이를 부분적으로 가져와서 표시합니다. 보시다시피 여기에는 대기 시간이 꽤 높습니다. 또한 System X의 처리량이 낮다는 것을 알 수 있습니다. System X에는 데이터베이스 잠금이 자주 발생합니다.

두 시스템 모두 CPU와 RAM이 풍부하며 내가 볼 수 있는 것은 디스크 성능 문제뿐입니다.

추가 정보가 없으면 대기 시간이 미친 것 같습니다. 그렇죠? 첫 번째 조언은 시스템을 전용 데이터 저장소(및 기본 디스크)로 분리하라는 것이었습니다. 두 시스템 모두 IOPS 요구 사항이 매우 높은 경향이 있기 때문입니다.

아쉽게도 자세한 내용은 많지 않습니다. 하지만 마지막에 물어볼 만한 좋은 질문 몇 가지를 찾고 있습니다. 파일 시스템 및 마운트 옵션, 디스크 프로비저닝(thin/thick)을 살펴보고 dd/hdparm/fio를 사용하여 몇 가지 테스트를 수행할 계획입니다. RAID에 후기입이 있는지 확인하세요. 또 무엇을 확인해야 합니까?

고마워요, MMF

관련 정보